Apple Machine Learning の最新記事

公式

94件の記事

SQUIRE: スロットクエリ中間表現によるインタラクティブUI作成

研究者らが、SQUIREというAI支援UIプロトタイピング手法を開発した。この手法は、曖昧さを減らし生成を制御する中間表現を用いて、フロントエンド開発者の反復作業を効率化する。

異種嗜好アラインメントのためのパーソナライズドグループ相対ポリシー最適化

研究者らは、大規模言語モデル（LLM）が多様な個人嗜好に適合できない問題に対処するため、パーソナライズドグループ相対ポリシー最適化（P-GRPO）を提案した。この手法は、従来のGRPOがグループ内でサンプルを交換可能と仮定する制限を克服し、異なるユーザーグループの嗜好に個別に適合するポリシーを学習する。

Apple Machine Learning·4月2日·★★★★

ProText：長文テキストにおける（誤った）性別表現を測定するためのベンチマークデータセット

研究者らは、多様なスタイルの長文英語テキストにおける性別表現と誤った性別表現を測定するデータセット「ProText」を発表した。このデータセットは、要約や書き換えなどのテキスト変換における性別表現の問題を調査するために設計されている。

Apple Machine Learning·3月31日

エントロピー保存強化学習

研究者らは、政策勾配アルゴリズムが訓練中にエントロピーを減少させ、探索の多様性を制限する問題を指摘し、エントロピー保存による多様な解決策の促進を提案している。

Apple Machine Learning·3月30日·★★★★

実データを超えて：正則化の観点から見た合成データ

研究者らは、実データが不足する場合に合成データが汎化性能を向上させるが、過度な依存は性能低下を招く可能性があると指摘し、合成データと実データのトレードオフを定量化する学習理論的枠組みを提案した。

Apple Machine Learning·3月30日·★★★★

ガウシアンを減らし、テクスチャを増やす：4Kフィードフォワードテクスチャスプラッティング

研究チームがLGTMを開発した。既存手法の解像度拡張性問題を解決し、コンパクトなガウシアンとテクスチャ予測により4K高解像度合成を可能にした。

Apple Machine Learning·3月28日·★★★★

無限へと向かう：ツール利用が状態空間モデルの長さ一般化を可能にする

研究者らは、状態空間モデル（SSM）が理論的に「真に長文」生成問題を正確に解決できないことを示したが、ツール利用によってこの制限を克服し長さ一般化を実現できると報告した。

Apple Machine Learning·3月27日·★★★★

Athena: LLMを用いた反復的足場付きアプリ生成のための中間表現

研究チームが、大規模言語モデル(LLM)による完全なユーザーインターフェース生成の課題を解決するため、複数ファイル間の関係を管理する中間表現「Athena」を開発した。

Apple Machine Learning·3月27日·★★★★

3Dガウシアンスプラッティングのためのドロップイン知覚最適化

研究チームは、3Dガウシアンスプラッティングの知覚最適化戦略を体系的に探索し、39,320件の主観評価を含む大規模人間評価研究を実施した。これにより、従来のピクセルレベル損失によるぼやけたレンダリング問題を改善する手法を提案している。

Apple Machine Learning·3月26日·★★★★

大規模言語モデル訓練における下流タスク指標のスケーリング特性の再検討

研究チームが、大規模言語モデルの訓練予算からベンチマーク性能のスケーリングを直接モデル化する枠組みを提案し、固定トークン対パラメータ比率では単純なべき法則が複数の下流タスクの精度を正確に記述できることを発見した。

Apple Machine Learning·3月26日·★★★★

独占的自己注意（XSA）の独自紹介

研究者はTransformerの自己注意を改良した「独占的自己注意（XSA）」を発表した。これはトークン自身の情報を除外し、直交する情報のみに焦点を当てる手法で、最大27億パラメータのモデルにおいて言語モデリング性能を向上させる。

Apple Machine Learning·3月25日·★★★★

未来を見据える思考：トランスフォーマーの潜在先読みトレーニング

OpenAIの研究者が、従来の次トークン予測に代わる潜在先読みトレーニングを提案。この手法は、トランスフォーマーモデルが複数の可能性を探索・反映できるようにし、計算リソースを柔軟に配分することで、生成品質と推論能力の向上を目指す。

Apple Machine Learning·3月25日·★★★★

エージェントのための合成タスク生成のスケーリング：探索によるアプローチ

研究者らが、マルチモーダル大規模言語モデル（MLLM）のポストトレーニングにおける課題として、多様で実行可能な高品質なタスクデータセットの不足を指摘し、探索ベースの合成タスク生成手法を提案している。

Apple Machine Learning·3月24日·★★★★

SafetyPairs: 反事実的画像生成による安全性クリティカルな画像特徴の分離

ICLR 2026ワークショップで採択された論文では、侮辱的なジェスチャーなどの微妙な変化が画像の安全性を大きく変える問題に対し、既存のデータセットの曖昧さを克服するため、反事実的画像生成を用いて安全性クリティカルな特徴を分離する手法を提案している。

Apple Machine Learning·3月24日·★★★★

トークンで学習、概念で調整：LLMにおける意味的キャリブレーションの出現

研究チームは、大規模言語モデル（LLM）がトークンレベルを超えて回答の意味に対する信頼度を評価できる「意味的キャリブレーション」を発見した。サンプリングベースの手法により、LLMはオープンドメイン質問応答タスクで有意な信頼度推定が可能であることを示した。

Apple Machine Learning·3月24日·★★★★

混合から専門領域への言語モデルの最適分割

研究チームが、言語モデルの事前学習後に専門データで特殊化する標準手法を、複数領域設定で最適に分割する方法を提案した。ICLR 2026ワークショップで採択された。

Apple Machine Learning·3月23日

ゴルディロックスRL：推論のためのスパース報酬から脱却するためのタスク難易度調整

研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。

Apple Machine Learning·3月18日·★★★★

Prose2Policy (P2P): 自然言語アクセスポリシーを実行可能なRegoコードに変換する実用的なLLMパイプライン

Prose2Policy (P2P)は、自然言語のアクセス制御ポリシーをOpen Policy AgentのRegoコードに変換するLLMベースのツールで、ポリシー検出から自動テスト生成までをカバーするエンドツーエンドパイプラインを提供する。

Apple Machine Learning·3月18日·★★★★

TrajTok：軌跡トークンの学習により動画理解が向上

研究者らが、動画モデルの効率と拡張性を向上させるため、外部パイプラインに依存しない統合型トークナイザー「TrajTok」を提案した。

Apple Machine Learning·3月17日·★★★★

AMES：後期相互作用検索による近似マルチモーダルエンタープライズ検索

研究者らがAMESを発表。テキスト・画像・動画を共有表現空間に埋め込み、アーキテクチャ再設計なしで生産環境のエンタープライズ検索エンジンにマルチモーダル後期相互作用検索を導入可能と実証した。

Apple Machine Learning·3月17日·★★★★

RubiCap: ルーブリックに基づく強化学習による詳細な画像キャプション生成

研究者らは、高品質な画像キャプション生成の課題に対処するため、ルーブリックに基づく強化学習手法「RubiCap」を提案した。この手法は、多様性と汎化性を向上させ、大規模な注釈コストを削減することを目指している。

Apple Machine Learning·3月16日·★★★★

mAceReason-Math：RLVR対応の高品質多言語数学問題データセット

研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習（RLVR）の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。

Apple Machine Learning·3月13日·★★★★

多言語推論ジム：手続き的推論環境の多言語スケーリング

研究者らは、14言語で検証可能な推論問題を手続き的に生成する「多言語推論ジム」を発表した。94のタスクテンプレートを10言語でネイティブ話者検証し、言語的自然さを確保した。

Apple Machine Learning·3月13日·★★★★

LiTo: 表面ライトフィールドのトークン化

研究者らが、物体の3D形状と視点依存の外観を同時にモデル化する3D潜在表現を提案した。従来手法は3D形状再構成か視点非依存の外観予測に焦点を当てていたため、現実的な視点依存効果の再現が困難だった。本手法はRGB-D画像が表面ライトフィールドのサンプルを提供する点を活用し、そのランダムサブサンプルをコンパクトな潜在ベクトルセットに符号化することで、両方を表現することを学習する。

Apple Machine Learning·3月12日·★★★★

ロバストな動画顔偽造検出のためのマルチ周波数融合

研究チームが、単一の軽量な融合手法で2つの手作り特徴量を組み合わせ、より少ないパラメータで高精度な動画顔偽造検出を実現した。Xceptionベースモデルに低周波ウェーブレット特徴と位相特徴を融合するLFWS、およびウェーブレット特徴とLBPを融合するLFWLを構築した。

Apple Machine Learning·3月6日

半離散カップリングを用いたフローマッチング

研究者らが、ODEを積分してノイズからデータを生成するフローモデルの学習手法「フローマッチング」を、半離散カップリングを用いて改善する方法を提案した。

Apple Machine Learning·3月6日

GenCtrl -- 生成モデルのための形式的制御可能性ツールキット

研究者らは、生成モデルの制御可能性を理論的に評価する枠組みを提案し、人間とモデルの相互作用を制御プロセスとして捉えた新アルゴリズムを開発した。

Apple Machine Learning·3月6日

幻覚スパン検出のための推論学習

研究者が、大規模言語モデルの幻覚（根拠のない生成内容）をスパン単位で検出するために、明示的な推論プロセスを導入する手法を提案した。従来の二値分類ではなく多段階判断を可能にし、信頼性向上を目指す。

Apple Machine Learning·3月3日·★★★★

EMBridge：クロスモーダル表現学習による筋電信号からのジェスチャー汎化の向上

研究チームは、高品質な構造化データ（映像・画像・骨格）の埋め込みと筋電信号を整合させることで、筋電信号の表現品質を向上させ、ウェアラブルデバイスでの連続ジェスチャー予測を可能にするEMBridgeを提案した。

Apple Machine Learning·3月3日·★★★★

知性と判断の分離不可能性：AIアライメントのためのフィルタリングの計算論的困難性について

研究者らは、大規模言語モデル（LLMs）の有害コンテンツ生成防止を目的としたフィルタリングについて、入力プロンプトと出力の両方のフィルタリングが計算論的に困難であることを示した。

Apple Machine Learning·3月3日·★★★★

私たちの認識の仕方が本当に重要である：区別可能なバリエーションによるUIコンポーネントのインスタンス化

フロントエンド開発者は、視覚的・行動的特性をパラメータ化してUIコンポーネントを広く再利用可能に作成するが、これによりインスタンス化が困難になる。この問題に対処するため、研究者らは模倣的かつ明確に区別可能な「区別可能なバリエーション」を導入し、開発者がコンポーネントの設計空間を探索しやすくする手法を提案している。

Apple Machine Learning·2月27日