Apple Machine Learning の最新記事

公式

78件の記事

BalCapRL:強化学習に基づく多モーダル大規模言語モデルの画像キャプション作成のためのバランス型フレームワーク

研究者らは、既存の評価指標が特定の品質に偏りトレードオフを生む課題を解決するため、詳細かつ正確な画像キャプション生成を実現する新しい強化学習ベースのバランス型フレームワーク「BalCapRL」を発表した。

Apple Machine Learning·5月11日·★★★★

Velox:4D 幾何形状と外観の表現学習フレームワーク

研究者らは、非構造化動的点群から物体の幾何形状と外観を忠実に捉える潜在表現を学習する「Velox」フレームワークを発表した。この手法は時空間カラー点群を圧縮し、下流タスクの効率化に寄与する。

Apple Machine Learning·5月8日·★★★★

リスク感受性アライメント手法「RVPO」の提案:報酬分散による正則化

研究者らは、従来の RLHF が特定の目標での高得点が他の重要な失敗を隠す欠点があると指摘し、報酬間の分散を罰する新手法「RVPO」を提案した。これにより、安全性やフォーマットなどのボトルネック課題を克服し、多目的アライメントの信頼性を向上させる。

Apple Machine Learning·5月8日·★★★★

プライバシーを保護する機械学習とAIに関するアップル・ワークショップ2026

アップルは、AIの普及に伴いプライバシー保護が重要であるとし、最先端の研究を推進するため、プライバシーを維持しながら革新的なAI体験を提供するための技術開発について議論するワークショップを開催した。

Apple Machine Learning·5月8日

マルチビュー撮影から大規模高品質 3D ガウス頭部再構築手法「HeadsUp」を提案

研究者らは、多数のカメラからの入力画像を圧縮し、中性頭部テンプレートに固定された UV パラメータ化された 3D ガウシアンとして復元するスケーラブルなフィードフォワード手法「HeadsUp」を発表した。この手法は、入力画像の数や解像度に関わらず 3D ガウシアンの数を独立させられる。

Apple Machine Learning·5月8日·★★★★

テキスト条件付き JEPA:意味豊かな視覚表現を学習する手法

研究者らは、マスクされた位置の視覚的不確実性を軽減するため、画像キャプションを活用した「Text-Conditional JEPA(TC-JEPA)」を提案し、より意味豊かな視覚表現の学習を実現しました。

Apple Machine Learning·5月7日·★★★★

実用的な学習型画像圧縮において重要なのは何か

研究者らは、人間の視覚系に最適化された実用的な画像コーデックの設計における重要なモデル選択を包括的に研究し、知覚品質と実行時間の両立を目指す。

Apple Machine Learning·5月7日·★★★★

SpecMD:予測的専門家プリフェッチングに関する包括的研究

研究者らは、Mixture-of-Experts モデルの性能向上に不可欠な専門家のキャッシュ機構について、既存のハードウェア中心の方策との相互作用を解明するため、標準化された研究手法「SpecMD」を開発した。

Apple Machine Learning·5月6日·★★★★

反復的ノイズ除去を備えた正規化フローの定式化

研究者が、画像生成モデルの性能向上を目指すため、拡散モデルとは異なる完全なエンドツーエンド方式を採用した「iTARFlow」という新しい手法を開発しました。

Apple Machine Learning·5月6日·★★★★

多モーダル LLM の空間・機能知能を評価するベンチマーク「SFI-Bench」の提案

研究者らは、既存のベンチマークが幾何学的知覚に留まる課題を指摘し、物的存在の場所だけでなく目的を理解する高次認知能力を評価する動画ベースのベンチマーク「SFI-Bench」を発表した。

Apple Machine Learning·5月6日·★★★★

確率的 KV ルーティング:適応型深層別キャッシュ共有を実現

研究者らは、トランスフォーマー言語モデルの推論コスト削減のため、時間軸以外の「深さ」次元に焦点を当てた新しい手法「確率的 KV ルーティング」を提案し、キーバリューキャッシュのメモリ使用量を大幅に削減できることを示した。

Apple Machine Learning·5月5日·★★★★

PORTool:多ツール統合推論における報酬付きツリーを用いた重要度認識型方策最適化手法

研究チームは、大規模言語モデル(LLM)を活用したエージェントの訓練において、成果のみによる報酬では中間ステップの評価が曖昧になる課題を解決するため、重要度を考慮しツール使用能力を強化する新アルゴリズム「PORTool」を発表しました。

Apple Machine Learning·5月4日·★★★★

リインフォースド・エージェント:ツール呼び出し型エージェントへの推論時フィードバック

ACL 2026 ワークショップで採択された研究が、LLM の軌道評価が事後処理に留まる課題を指摘し、実行ループ内でリアルタイムに修正可能な「リインフォースド・エージェント」の手法を提案した。

Apple Machine Learning·5月1日·★★★★

音声・信号処理国際会議 ICASSP 2026 にアップルが新研究を発表

アップルはスペイン・バルセロナで開催される「ICASSP 2026」で、信号処理およびその応用に関する新たな研究成果を発表し、同会議をスポンサーとして支援する。

Apple Machine Learning·4月30日

正規化フローを用いたエンドツーエンド動画生成モデル「STARFlow-V」の発表

研究チームは、計算コストが高い動画生成領域において拡散モデルに代わる手法として、正規化フローに基づく新しい動画生成モデル「STARFlow-V」を発表した。

Apple Machine Learning·4月30日·★★★★

手話モデルを用いた手話注釈の自己開始的生成手法

研究者らは、高品質な手話データ不足という課題に対し、動画と英語を入力として候補注釈を自動生成する疑似注釈パイプラインを開発した。これにより、コストのかかる大規模注釈作業を軽減し、未利用のデータを活用可能にする。

Apple Machine Learning·4月30日·★★★★

バイアス軽減のための直接ステアリング最適化(DSO)手法の提案

生成モデルが視覚障害者支援などで意思決定を行う際、入力画像の人種や性別などの属性に依存したバイアスが結果に影響を与える問題がある。この研究では、性能低下を最小限に抑えつつバイアスを軽減する「直接ステアリング最適化(DSO)」手法を提案し、ユーザーのニーズに応じたバランス調整を実現する。

Apple Machine Learning·4月29日·★★★★

適応的思考:大規模言語モデルは潜在空間での思考の必要性を認識している

研究チームは、推論時の計算コスト最適化に向け、クエリの複雑度に応じて大規模言語モデルが潜在的な思考(中間推論)を行うタイミングを自己一貫性手法で制御する新アプローチを発表した。

Apple Machine Learning·4月29日·★★★★

LaDiR:潜在拡散がLLMのテキスト推論能力を強化

アント・リンボーは、連続的な潜在表現の表現力と反復的修正機能を統合した新規推論フレームワークLaDiRを提案。この手法は、LLMの連鎖的思考生成における限界を克服し、より効率的かつ多様な解決策の探索を可能にする。

Apple Machine Learning·4月28日·★★★★

条件付き拡散モデルにおける構成的一般化の局所的メカニズム

研究者らは、訓練時に経験していないオブジェクト数を持つ画像生成能力(長さ一般化)について、制御された環境で検証した。その結果、場合によっては達成可能だが常に成功するわけではないことが示され、この能力の背後にあるメカニズムが不明確であることが確認された。

Apple Machine Learning·4月28日

StereoFoley:映像から物体認識型ステレオ音声を生成するフレームワーク

研究者らは、映像から意味的に整合し時間同期された空間正確なステレオ音声を 48kHz で生成する「StereoFoley」というフレームワークを発表した。既存モデルがモノラルに限定される中、この手法は物体認識に基づく立体音像を実現する。

Apple Machine Learning·4月28日·★★★★

効率的な運動学生成のための長期運動埋め込みの学習

研究者らは、トラッカーモデルから得た大規模軌道データから長期運動埋め込みを学習する手法を開発し、動画合成に代わってシーン動態を効率的にモデル化・生成する技術を実現した。

Apple Machine Learning·4月24日·★★★★

ParaRNN:並列学習可能な大規模非線形RNN

アップル研究所は、RNNの並列学習手法「ParaRNN」を開発し、数十億パラメータ規模の大規模RNN学習を初めて可能にした。これにより推論効率の高いモデル設計の選択肢が広がった。

Apple Machine Learning·4月23日·★★★★

ICLR 2026におけるAppleの機械学習研究

アップルは機械学習の基礎研究を推進し、ICLR 2026で研究成果を発表するとともに会議をスポンサー支援している。

Apple Machine Learning·4月22日

「大規模言語モデルは文脈を理解できるか?」

著者たちは、大規模言語モデル(LLM)の文脈理解能力を評価する新たなベンチマークを作成し、既存データセットを基に提示した。

Apple Machine Learning·4月21日·★★★★

モデルのロジットは何を保持しているのか?(答えは驚くべきものかもしれない!)

研究者はビジョン言語モデルを用い、内部ロジットから生成出力へ圧縮される過程で保持される情報の違いを比較した。これにより、モデル所有者が想定しない情報がユーザーに漏洩するリスクを明らかにした。

Apple Machine Learning·4月20日·★★★★

2026年国際学習表現会議(ICLR)におけるアップルの発表

アップルは、ブラジル・リオデジャネイロで開催される2026年の国際学習表現会議で、深層学習分野の科学者や産業研究者を対象に新たな研究成果を発表し、同会議をスポンサーとして支援する。

Apple Machine Learning·4月17日

MixAtlas: マルチモーダルLLM事前学習のための不確実性を考慮したデータ混合最適化

研究チームが、マルチモーダル事前学習のための計算効率的なデータ混合最適化フレームワーク「MixAtlas」を提案した。従来の単一視点の手法を超え、不確実性を考慮した混合最適化により、サンプル効率と下流タスクの汎化性能を向上させる。

Apple Machine Learning·4月16日·★★★★

サブサンプリングとランダム割り当てにおける効率的なプライバシー損失計算

著者らは、tステップ中からkステップをランダムに選択するサンプリング手法のプライバシー増幅特性を検討し、差分学習やプライベート集約において標準手法より有用性が高いことを示した。

Apple Machine Learning·4月13日·★★★★

詰め込みを減らして記憶を増やす:訓練データの剪定が事実の記憶を改善

ICLR 2026のワークショップで採択された研究が、情報理論の観点から事実記憶を定式化し、訓練データ分布が事実精度に与える影響を分析した。大規模言語モデル(LLM)は事実知識の記憶に苦戦し、幻覚や知識集約型タスクでの低性能を招くが、訓練データの剪定が記憶を改善できることを示した。

Apple Machine Learning·4月13日·★★★★

ACMヒューマンコンピュータインタラクション会議(CHI)2026

Appleが、4月13日から17日にスペイン・バルセロナで開催されるACM CHI会議で新たな研究を発表し、同会議を再びスポンサーする。

Apple Machine Learning·4月10日

LaCy: 小規模言語モデルが学ぶべきことは損失だけの問題ではない

研究者らが、小規模言語モデル(SLM)の知識容量の限界と事実誤認の問題を指摘し、外部情報源へのアクセスによる改善策を提案した。

Apple Machine Learning·4月9日

音響的近傍埋め込みの理論的枠組み

研究者らが、可変幅の音声やテキストの音韻内容を固定次元の埋め込み空間で表現する「音響的近傍埋め込み」の理論的枠組みを提案した。単語間の音韻的類似性の定量的定義に基づき、埋め込み間の距離の確率的解釈を提供し、原理に基づいた理解と応用を可能にする。

Apple Machine Learning·4月9日

マルチエージェントAIシステムにおける閉ループ強制のためのガバナンス対応エージェントテレメトリー

研究チームが、マルチエージェントAIシステム向けの「ガバナンス対応エージェントテレメトリー(GAAT)」を提案。既存ツールは監視のみでリアルタイム強制ができず、ポリシー違反は事後検出だったが、GAATは参照アーキテクチャで閉ループ強制を実現する。

Apple Machine Learning·4月8日·★★★★

SQUIRE: スロットクエリ中間表現によるインタラクティブUI作成

研究者らが、SQUIREというAI支援UIプロトタイピング手法を開発した。この手法は、曖昧さを減らし生成を制御する中間表現を用いて、フロントエンド開発者の反復作業を効率化する。

Apple Machine Learning·4月6日

異種嗜好アラインメントのためのパーソナライズドグループ相対ポリシー最適化

研究者らは、大規模言語モデル(LLM)が多様な個人嗜好に適合できない問題に対処するため、パーソナライズドグループ相対ポリシー最適化(P-GRPO)を提案した。この手法は、従来のGRPOがグループ内でサンプルを交換可能と仮定する制限を克服し、異なるユーザーグループの嗜好に個別に適合するポリシーを学習する。

Apple Machine Learning·4月2日·★★★★

ProText:長文テキストにおける(誤った)性別表現を測定するためのベンチマークデータセット

研究者らは、多様なスタイルの長文英語テキストにおける性別表現と誤った性別表現を測定するデータセット「ProText」を発表した。このデータセットは、要約や書き換えなどのテキスト変換における性別表現の問題を調査するために設計されている。

Apple Machine Learning·3月31日

エントロピー保存強化学習

研究者らは、政策勾配アルゴリズムが訓練中にエントロピーを減少させ、探索の多様性を制限する問題を指摘し、エントロピー保存による多様な解決策の促進を提案している。

Apple Machine Learning·3月30日·★★★★

実データを超えて:正則化の観点から見た合成データ

研究者らは、実データが不足する場合に合成データが汎化性能を向上させるが、過度な依存は性能低下を招く可能性があると指摘し、合成データと実データのトレードオフを定量化する学習理論的枠組みを提案した。

Apple Machine Learning·3月30日·★★★★

ガウシアンを減らし、テクスチャを増やす:4Kフィードフォワードテクスチャスプラッティング

研究チームがLGTMを開発した。既存手法の解像度拡張性問題を解決し、コンパクトなガウシアンとテクスチャ予測により4K高解像度合成を可能にした。

Apple Machine Learning·3月28日·★★★★

無限へと向かう:ツール利用が状態空間モデルの長さ一般化を可能にする

研究者らは、状態空間モデル(SSM)が理論的に「真に長文」生成問題を正確に解決できないことを示したが、ツール利用によってこの制限を克服し長さ一般化を実現できると報告した。

Apple Machine Learning·3月27日·★★★★

Athena: LLMを用いた反復的足場付きアプリ生成のための中間表現

研究チームが、大規模言語モデル(LLM)による完全なユーザーインターフェース生成の課題を解決するため、複数ファイル間の関係を管理する中間表現「Athena」を開発した。

Apple Machine Learning·3月27日·★★★★

3Dガウシアンスプラッティングのためのドロップイン知覚最適化

研究チームは、3Dガウシアンスプラッティングの知覚最適化戦略を体系的に探索し、39,320件の主観評価を含む大規模人間評価研究を実施した。これにより、従来のピクセルレベル損失によるぼやけたレンダリング問題を改善する手法を提案している。

Apple Machine Learning·3月26日·★★★★

大規模言語モデル訓練における下流タスク指標のスケーリング特性の再検討

研究チームが、大規模言語モデルの訓練予算からベンチマーク性能のスケーリングを直接モデル化する枠組みを提案し、固定トークン対パラメータ比率では単純なべき法則が複数の下流タスクの精度を正確に記述できることを発見した。

Apple Machine Learning·3月26日·★★★★

独占的自己注意(XSA)の独自紹介

研究者はTransformerの自己注意を改良した「独占的自己注意(XSA)」を発表した。これはトークン自身の情報を除外し、直交する情報のみに焦点を当てる手法で、最大27億パラメータのモデルにおいて言語モデリング性能を向上させる。

Apple Machine Learning·3月25日·★★★★

未来を見据える思考:トランスフォーマーの潜在先読みトレーニング

OpenAIの研究者が、従来の次トークン予測に代わる潜在先読みトレーニングを提案。この手法は、トランスフォーマーモデルが複数の可能性を探索・反映できるようにし、計算リソースを柔軟に配分することで、生成品質と推論能力の向上を目指す。

Apple Machine Learning·3月25日·★★★★

エージェントのための合成タスク生成のスケーリング:探索によるアプローチ

研究者らが、マルチモーダル大規模言語モデル(MLLM)のポストトレーニングにおける課題として、多様で実行可能な高品質なタスクデータセットの不足を指摘し、探索ベースの合成タスク生成手法を提案している。

Apple Machine Learning·3月24日·★★★★

SafetyPairs: 反事実的画像生成による安全性クリティカルな画像特徴の分離

ICLR 2026ワークショップで採択された論文では、侮辱的なジェスチャーなどの微妙な変化が画像の安全性を大きく変える問題に対し、既存のデータセットの曖昧さを克服するため、反事実的画像生成を用いて安全性クリティカルな特徴を分離する手法を提案している。

Apple Machine Learning·3月24日·★★★★

トークンで学習、概念で調整:LLMにおける意味的キャリブレーションの出現

研究チームは、大規模言語モデル(LLM)がトークンレベルを超えて回答の意味に対する信頼度を評価できる「意味的キャリブレーション」を発見した。サンプリングベースの手法により、LLMはオープンドメイン質問応答タスクで有意な信頼度推定が可能であることを示した。

Apple Machine Learning·3月24日·★★★★

混合から専門領域への言語モデルの最適分割

研究チームが、言語モデルの事前学習後に専門データで特殊化する標準手法を、複数領域設定で最適に分割する方法を提案した。ICLR 2026ワークショップで採択された。

Apple Machine Learning·3月23日