メインコンテンツへスキップ

Apple Machine Learning の最新記事

公式

94件の記事

残差コンテキスト拡散言語モデル

Apple Machine Learning は、拡散大規模言語モデル(dLLMs)において、破棄されたトークンの計算を再利用する手法を示し、並列デコードの効率性を向上させる研究を発表した。

Apple Machine Learning·7月2日·★★★★

計算リソース制約下での推論におけるリスク管理:コンフォーマル思考

Apple Machine Learning は、大規模言語モデルの推論において、トークン予算と適応的推論の閾値設定をリスク制御問題として再定義する「コンフォーマル思考」手法を発表した。これにより、計算リソースの制約下で信頼性と精度のトレードオフを最適化するアプローチが示された。

Apple Machine Learning·7月2日·★★★★

非因果的ドメイン一般化:ラベルなしデータを活用する研究

Apple Machine Learning は、環境変化に強い予測モデルを構築するため、アウトカムが共変量を決定する非因果設定において、ラベルなしデータを活用したドメイン一般化手法の研究を発表しました。

Apple Machine Learning·7月2日·★★★★

拡散言語モデルにおけるアンマスキングポリシーの学習

Apple Machine Learning は、拡散型大規模言語モデル(dLLMs)の推論効率を高めるため、トークンのアンマスキング順序を決定する新しい学習手法を提案した。これにより、サンプル品質と処理速度の向上が期待される。

Apple Machine Learning·7月2日·★★★★

マルチエージェントチームは専門家の能力を阻害する

Apple Machine Learning は、自律的な協働を行うマルチエージェント LLM システムにおいて、固定された役割やワークフローに依存しない自己組織化型チームの性能について調査し、既存の制約が専門家の能力を妨げる可能性を示唆した。

Apple Machine Learning·7月2日·★★★★

VideoFlexTok:柔軟な長さの粗から細への動画トークン化手法

Apple Machine Learning は、動画を時空間グリッドで表現する既存手法を改善し、柔軟な長さに適応できる粗から細への動画トークン化技術「VideoFlexTok」を発表した。

Apple Machine Learning·7月2日·★★★★

学習されたサポート関数を用いた最大内積探索の費用平準化

Apple Machine Learning は、既知の分布から得られるクエリに対して固定データベース内のベクトルを効率的に検索する手法として、ニューラルネットワークで直接解を予測する回帰ベースのアプローチ「Amortized MIPS」を提案した。

Apple Machine Learning·7月2日·★★★★

強化学習微調整済み視覚言語モデルの頑健性と思考連鎖の一貫性に関する研究

Apple Machine Learning は、強化学習で微調整した視覚言語モデルが、誤ったキャプションや思考連鎖の痕跡といった単純なテキスト摂動に対して脆弱であることを示し、視覚的根拠の弱さやハルシネーションの問題を明らかにしました。

Apple Machine Learning·7月2日·★★★★

MemoryLLM:トランスフォーマー向けのプラグ・アンド・プレイ型解釈可能なフィードフォワードメモリ

Apple Machine Learning は、トランスフォーマーの構成要素を解明する研究の一環として、フィードフォワードモジュールと自己注意機構を分離し、文脈に依存しないトークンごとのニューラル検索メモリを実現する「MemoryLLM」を発表した。

Apple Machine Learning·7月2日·★★★★

扱い可能な軌道制御による構造化推論の学習

Apple Machine Learning は、大規模言語モデルが複雑な推論軌道を効率的に獲得できるよう、特定の推論パターンを体系的に発見・強化する「構造化推論」のパラダイムを提案した。

Apple Machine Learning·7月2日·★★★★

LLM評価パネルにおける相関誤差が信頼性を損なう:9人の判事、実効投票は2票のみ

Apple Machine Learningチームは、複数の大規模言語モデル(LLM)で構成される評価パネルの信頼性について調査した。その結果、9つの最先端モデルからなるパネルでも、相関する誤差により実質的な有効投票数は約2票に過ぎないことが判明した。

Apple Machine Learning·6月23日·★★★★

評価指標に依存する注釈飽和:ラベル分布からの学習における研究

Apple Machine Learning は、注釈者の不一致が信号となり得ることを示し、評価指標によって必要な注釈者数が異なる「注釈飽和」を特定した。NLI モデルの実験により、不一致を検出するエントロピー相関には約 20〜50 人の注釈者が必要であることが明らかになった。

Apple Machine Learning·6月23日·★★★★

Apple の第 3 世代ファウンデーションモデルの紹介

Apple は Google と共同開発した第 3 世代のファウンデーションモデル(AFM)5 つを発表し、プライバシーを重視する新アーキテクチャに基づき、オンデバイスからプライベートクラウドまで統合された次世代 AI を提供すると発表した。

Apple Machine Learning·6月8日·★★★★

IEEE/CVF コンピュータビジョン・パターン認識会議(CVPR)2026

Apple は、6 月 3 日から 7 日にデンバーで開催される CVPR 2026 に新研究を発表し、同会議をスポンサーとして支援する。

Apple Machine Learning·5月28日

VSAS-Bench:リアルタイム評価のための視覚ストリーミングアシスタントモデルのベンチマーク

Apple Machine Learning は、リアルタイム視覚アシスタントモデルの評価手法として、応答のタイミングや一貫性を測定する「VSAS-Bench」を発表した。既存のオフライン評価とは異なり、ストリーミング環境での性能を多角的に検証する新しい基準を提供する。

Apple Machine Learning·5月22日·★★★★

リソース制約環境における長期会話のためのエピソード KV キャッシュ管理手法「EpiCache」の発表

Apple Machine Learning は、長文対話時のメモリ使用量増大問題を解決する新手法「EpiCache」を発表した。この技術は、デバイス限界を超えないよう KV キャッシュを効率的に管理し、長期会話の実現を目指す。

Apple Machine Learning·5月19日·★★★★

BalCapRL:強化学習に基づく多モーダル大規模言語モデルの画像キャプション作成のためのバランス型フレームワーク

研究者らは、既存の評価指標が特定の品質に偏りトレードオフを生む課題を解決するため、詳細かつ正確な画像キャプション生成を実現する新しい強化学習ベースのバランス型フレームワーク「BalCapRL」を発表した。

Apple Machine Learning·5月11日·★★★★

Velox:4D 幾何形状と外観の表現学習フレームワーク

研究者らは、非構造化動的点群から物体の幾何形状と外観を忠実に捉える潜在表現を学習する「Velox」フレームワークを発表した。この手法は時空間カラー点群を圧縮し、下流タスクの効率化に寄与する。

Apple Machine Learning·5月8日·★★★★

リスク感受性アライメント手法「RVPO」の提案:報酬分散による正則化

研究者らは、従来の RLHF が特定の目標での高得点が他の重要な失敗を隠す欠点があると指摘し、報酬間の分散を罰する新手法「RVPO」を提案した。これにより、安全性やフォーマットなどのボトルネック課題を克服し、多目的アライメントの信頼性を向上させる。

Apple Machine Learning·5月8日·★★★★

プライバシーを保護する機械学習とAIに関するアップル・ワークショップ2026

アップルは、AIの普及に伴いプライバシー保護が重要であるとし、最先端の研究を推進するため、プライバシーを維持しながら革新的なAI体験を提供するための技術開発について議論するワークショップを開催した。

Apple Machine Learning·5月8日

マルチビュー撮影から大規模高品質 3D ガウス頭部再構築手法「HeadsUp」を提案

研究者らは、多数のカメラからの入力画像を圧縮し、中性頭部テンプレートに固定された UV パラメータ化された 3D ガウシアンとして復元するスケーラブルなフィードフォワード手法「HeadsUp」を発表した。この手法は、入力画像の数や解像度に関わらず 3D ガウシアンの数を独立させられる。

Apple Machine Learning·5月8日·★★★★

テキスト条件付き JEPA:意味豊かな視覚表現を学習する手法

研究者らは、マスクされた位置の視覚的不確実性を軽減するため、画像キャプションを活用した「Text-Conditional JEPA(TC-JEPA)」を提案し、より意味豊かな視覚表現の学習を実現しました。

Apple Machine Learning·5月7日·★★★★

実用的な学習型画像圧縮において重要なのは何か

研究者らは、人間の視覚系に最適化された実用的な画像コーデックの設計における重要なモデル選択を包括的に研究し、知覚品質と実行時間の両立を目指す。

Apple Machine Learning·5月7日·★★★★

SpecMD:予測的専門家プリフェッチングに関する包括的研究

研究者らは、Mixture-of-Experts モデルの性能向上に不可欠な専門家のキャッシュ機構について、既存のハードウェア中心の方策との相互作用を解明するため、標準化された研究手法「SpecMD」を開発した。

Apple Machine Learning·5月6日·★★★★

反復的ノイズ除去を備えた正規化フローの定式化

研究者が、画像生成モデルの性能向上を目指すため、拡散モデルとは異なる完全なエンドツーエンド方式を採用した「iTARFlow」という新しい手法を開発しました。

Apple Machine Learning·5月6日·★★★★

多モーダル LLM の空間・機能知能を評価するベンチマーク「SFI-Bench」の提案

研究者らは、既存のベンチマークが幾何学的知覚に留まる課題を指摘し、物的存在の場所だけでなく目的を理解する高次認知能力を評価する動画ベースのベンチマーク「SFI-Bench」を発表した。

Apple Machine Learning·5月6日·★★★★

確率的 KV ルーティング:適応型深層別キャッシュ共有を実現

研究者らは、トランスフォーマー言語モデルの推論コスト削減のため、時間軸以外の「深さ」次元に焦点を当てた新しい手法「確率的 KV ルーティング」を提案し、キーバリューキャッシュのメモリ使用量を大幅に削減できることを示した。

Apple Machine Learning·5月5日·★★★★

PORTool:多ツール統合推論における報酬付きツリーを用いた重要度認識型方策最適化手法

研究チームは、大規模言語モデル(LLM)を活用したエージェントの訓練において、成果のみによる報酬では中間ステップの評価が曖昧になる課題を解決するため、重要度を考慮しツール使用能力を強化する新アルゴリズム「PORTool」を発表しました。

Apple Machine Learning·5月4日·★★★★

リインフォースド・エージェント:ツール呼び出し型エージェントへの推論時フィードバック

ACL 2026 ワークショップで採択された研究が、LLM の軌道評価が事後処理に留まる課題を指摘し、実行ループ内でリアルタイムに修正可能な「リインフォースド・エージェント」の手法を提案した。

Apple Machine Learning·5月1日·★★★★

音声・信号処理国際会議 ICASSP 2026 にアップルが新研究を発表

アップルはスペイン・バルセロナで開催される「ICASSP 2026」で、信号処理およびその応用に関する新たな研究成果を発表し、同会議をスポンサーとして支援する。

Apple Machine Learning·4月30日

正規化フローを用いたエンドツーエンド動画生成モデル「STARFlow-V」の発表

研究チームは、計算コストが高い動画生成領域において拡散モデルに代わる手法として、正規化フローに基づく新しい動画生成モデル「STARFlow-V」を発表した。

Apple Machine Learning·4月30日·★★★★

手話モデルを用いた手話注釈の自己開始的生成手法

研究者らは、高品質な手話データ不足という課題に対し、動画と英語を入力として候補注釈を自動生成する疑似注釈パイプラインを開発した。これにより、コストのかかる大規模注釈作業を軽減し、未利用のデータを活用可能にする。

Apple Machine Learning·4月30日·★★★★

バイアス軽減のための直接ステアリング最適化(DSO)手法の提案

生成モデルが視覚障害者支援などで意思決定を行う際、入力画像の人種や性別などの属性に依存したバイアスが結果に影響を与える問題がある。この研究では、性能低下を最小限に抑えつつバイアスを軽減する「直接ステアリング最適化(DSO)」手法を提案し、ユーザーのニーズに応じたバランス調整を実現する。

Apple Machine Learning·4月29日·★★★★

適応的思考:大規模言語モデルは潜在空間での思考の必要性を認識している

研究チームは、推論時の計算コスト最適化に向け、クエリの複雑度に応じて大規模言語モデルが潜在的な思考(中間推論)を行うタイミングを自己一貫性手法で制御する新アプローチを発表した。

Apple Machine Learning·4月29日·★★★★

LaDiR:潜在拡散がLLMのテキスト推論能力を強化

アント・リンボーは、連続的な潜在表現の表現力と反復的修正機能を統合した新規推論フレームワークLaDiRを提案。この手法は、LLMの連鎖的思考生成における限界を克服し、より効率的かつ多様な解決策の探索を可能にする。

Apple Machine Learning·4月28日·★★★★

条件付き拡散モデルにおける構成的一般化の局所的メカニズム

研究者らは、訓練時に経験していないオブジェクト数を持つ画像生成能力(長さ一般化)について、制御された環境で検証した。その結果、場合によっては達成可能だが常に成功するわけではないことが示され、この能力の背後にあるメカニズムが不明確であることが確認された。

Apple Machine Learning·4月28日

StereoFoley:映像から物体認識型ステレオ音声を生成するフレームワーク

研究者らは、映像から意味的に整合し時間同期された空間正確なステレオ音声を 48kHz で生成する「StereoFoley」というフレームワークを発表した。既存モデルがモノラルに限定される中、この手法は物体認識に基づく立体音像を実現する。

Apple Machine Learning·4月28日·★★★★

効率的な運動学生成のための長期運動埋め込みの学習

研究者らは、トラッカーモデルから得た大規模軌道データから長期運動埋め込みを学習する手法を開発し、動画合成に代わってシーン動態を効率的にモデル化・生成する技術を実現した。

Apple Machine Learning·4月24日·★★★★

ParaRNN:並列学習可能な大規模非線形RNN

アップル研究所は、RNNの並列学習手法「ParaRNN」を開発し、数十億パラメータ規模の大規模RNN学習を初めて可能にした。これにより推論効率の高いモデル設計の選択肢が広がった。

Apple Machine Learning·4月23日·★★★★

ICLR 2026におけるAppleの機械学習研究

アップルは機械学習の基礎研究を推進し、ICLR 2026で研究成果を発表するとともに会議をスポンサー支援している。

Apple Machine Learning·4月22日

「大規模言語モデルは文脈を理解できるか?」

著者たちは、大規模言語モデル(LLM)の文脈理解能力を評価する新たなベンチマークを作成し、既存データセットを基に提示した。

Apple Machine Learning·4月21日·★★★★

モデルのロジットは何を保持しているのか?(答えは驚くべきものかもしれない!)

研究者はビジョン言語モデルを用い、内部ロジットから生成出力へ圧縮される過程で保持される情報の違いを比較した。これにより、モデル所有者が想定しない情報がユーザーに漏洩するリスクを明らかにした。

Apple Machine Learning·4月20日·★★★★

2026年国際学習表現会議(ICLR)におけるアップルの発表

アップルは、ブラジル・リオデジャネイロで開催される2026年の国際学習表現会議で、深層学習分野の科学者や産業研究者を対象に新たな研究成果を発表し、同会議をスポンサーとして支援する。

Apple Machine Learning·4月17日

MixAtlas: マルチモーダルLLM事前学習のための不確実性を考慮したデータ混合最適化

研究チームが、マルチモーダル事前学習のための計算効率的なデータ混合最適化フレームワーク「MixAtlas」を提案した。従来の単一視点の手法を超え、不確実性を考慮した混合最適化により、サンプル効率と下流タスクの汎化性能を向上させる。

Apple Machine Learning·4月16日·★★★★

サブサンプリングとランダム割り当てにおける効率的なプライバシー損失計算

著者らは、tステップ中からkステップをランダムに選択するサンプリング手法のプライバシー増幅特性を検討し、差分学習やプライベート集約において標準手法より有用性が高いことを示した。

Apple Machine Learning·4月13日·★★★★

詰め込みを減らして記憶を増やす:訓練データの剪定が事実の記憶を改善

ICLR 2026のワークショップで採択された研究が、情報理論の観点から事実記憶を定式化し、訓練データ分布が事実精度に与える影響を分析した。大規模言語モデル(LLM)は事実知識の記憶に苦戦し、幻覚や知識集約型タスクでの低性能を招くが、訓練データの剪定が記憶を改善できることを示した。

Apple Machine Learning·4月13日·★★★★

ACMヒューマンコンピュータインタラクション会議(CHI)2026

Appleが、4月13日から17日にスペイン・バルセロナで開催されるACM CHI会議で新たな研究を発表し、同会議を再びスポンサーする。

Apple Machine Learning·4月10日

LaCy: 小規模言語モデルが学ぶべきことは損失だけの問題ではない

研究者らが、小規模言語モデル(SLM)の知識容量の限界と事実誤認の問題を指摘し、外部情報源へのアクセスによる改善策を提案した。

Apple Machine Learning·4月9日

音響的近傍埋め込みの理論的枠組み

研究者らが、可変幅の音声やテキストの音韻内容を固定次元の埋め込み空間で表現する「音響的近傍埋め込み」の理論的枠組みを提案した。単語間の音韻的類似性の定量的定義に基づき、埋め込み間の距離の確率的解釈を提供し、原理に基づいた理解と応用を可能にする。

Apple Machine Learning·4月9日

マルチエージェントAIシステムにおける閉ループ強制のためのガバナンス対応エージェントテレメトリー

研究チームが、マルチエージェントAIシステム向けの「ガバナンス対応エージェントテレメトリー(GAAT)」を提案。既存ツールは監視のみでリアルタイム強制ができず、ポリシー違反は事後検出だったが、GAATは参照アーキテクチャで閉ループ強制を実現する。

Apple Machine Learning·4月8日·★★★★