#apple machine learning のAIニュース

47件の記事

能動的エージェント研究環境：評価用能動アシスタントのためのアクティブユーザーシミュレーション

Apple Machine Learning は、デジタル環境でのユーザー行動を現実的に再現する新フレームワーク「Pare」を発表し、能動型アシスタントの評価手法を確立した。

エージェント型交渉における行動プライバシー漏洩：ランダム化ポリシーによる推論攻撃の形式化と緩和

Apple Machine Learning が、保険や調達などの高リスク分野で展開される自律型交渉エージェントにおいて、暗号技術では防げない行動プライバシー漏洩という脅威を特定し、ランダム化ポリシーを用いた防御手法を提案した。

オンポリシー蒸留の真価：効果的な場面と有害な場面の解明とその理由

Apple Machine Learning は、推論モデルの訓練におけるオンポリシー蒸留が、どの条件下で有益となり、逆にどの条件下で有害となるかを明らかにする研究を発表した。また、教師モデルや自己蒸留時の文脈選択の最適化に関する課題についても言及している。

Apple Machine Learning·7月9日·★★★★

再帰型言語モデルと不確実性：長期コンテキストにおける自己反省型プログラム検索の驚くべき有効性

Apple Machine Learning は、長期コンテキスト処理における課題に対し、推論時にプログラムによる対話で文脈を再帰的に分解する「再帰型言語モデル（RLM）」が、自己反省型のプログラム検索を行うことで高い有効性を示すことを明らかにした。

Apple Machine Learning·7月9日·★★★★

FlowEval：生成されたユーザーインターフェースの評価基準に基づく評価手法の提案

Apple Machine Learning は、大規模言語モデルやコーディングエージェントが生成したユーザーインターフェースの視覚・インタラクション設計能力を、既存の手動または自動評価よりも正確かつ効率的に測定する「FlowEval」という参照ベースの評価フレームワークを発表しました。

Apple Machine Learning·7月7日·★★★★

MT-EditFlow：フローマッチングを用いた多ターン画像編集のための強化学習手法

Apple Machine Learning は、ユーザーがモデルの出力に基づいて画像を反復的に修正する多ターン編集において既存モデルが失敗する課題に対し、強化学習とフローマッチングを組み合わせた「MT-EditFlow」を発表した。

Apple Machine Learning·7月7日·★★★★

大規模言語モデルの安全アライメントを単一ニューロンで回避可能であることを実証

Apple Machine Learning の研究チームは、言語モデルの安全アライメントが拒絶ニューロンと概念ニューロンの 2 つのシステムで構成されていることを明らかにし、各システムの単一ニューロンを操作することで安全回避や有害コンテンツ生成が可能であることを示した。

Apple Machine Learning·7月7日·★★★★★

高度なモダリティ条件と相互作用によるテキストから音付き動画生成の制御に関する研究

Apple Machine Learning は、テキストから同期された音声付き動画を生成する技術（T2SV）について研究し、テキスト条件のボトルネック解消やクロスモーダル融合機構の最適化に向けた課題を明らかにした。

Apple Machine Learning·7月7日·★★★★

DynaMiCS：パフォーマンス制約付きのLLMを動的混合で微調整する手法

Apple Machine Learning は、一般知識や安全性などの既存能力を維持しつつ目標ドメインのパフォーマンスを向上させるため、多領域微調整を制約最適化問題として定式化した「DynaMiCS」という動的混合最適化手法を発表した。

Apple Machine Learning·7月7日·★★★★

LensVLM：テキストの圧縮された視覚表現のための選択的コンテキスト拡張

Apple Machine Learning は、画像エンコーダーの解像度限界により文字が判別不能になる問題を解決するため、圧縮度を調整する「選択的コンテキスト拡張」技術を持つ新しいビジョンランゲージモデル「LensVLM」を発表した。

Apple Machine Learning·7月7日·★★★★

TopoPrimer：予測モデルに欠けていたトポロジカル文脈を補完するフレームワーク

Apple Machine Learning は、時系列データの集団におけるグローバルなトポロジカル構造を明示的な入力として取り込む「TopoPrimer」というフレームワークを発表した。これにより、多様なドメインでの予測精度が向上し、季節的な需要急増下でも安定し、新規データ不足の問題も解決する。

Apple Machine Learning·7月6日·★★★★

専門モデルを用いた音声認識誤り訂正の再検討

Apple Machine Learning は、リアルおよび合成音声の誤りを学習したコンパクトなシーケンス・ツー・シーケンスモデルにより、遅延や幻覚の問題を回避しつつ音声認識の誤り訂正性能を向上させる手法を発表しました。

Apple Machine Learning·7月6日·★★★★

連続拡散型音声言語モデルのスケーリング特性に関する研究

Apple Machine Learning は、従来の離散自己回帰型モデルのボトルネックを解消するため、連続拡散型音声言語モデル（SLM）の有効性を検証した。この研究では、音素 Jensen-Shannon 発散度という新指標を用いて分析し、連続拡散型 SLM がテキストモデルに匹敵する性能を持つ可能性を示唆している。

Apple Machine Learning·7月6日·★★★★

パス制約付き混合専門家モデル

Apple Machine Learning は、トークンが各層で選択する専門家の順序を「パス」として捉える新視点を提案し、実際のトークンは言語機能に合致した限られたパスに集中していることを示した。

Apple Machine Learning·7月6日·★★★★

残差コンテキスト拡散言語モデル

Apple Machine Learning は、拡散大規模言語モデル（dLLMs）において、破棄されたトークンの計算を再利用する手法を示し、並列デコードの効率性を向上させる研究を発表した。

Apple Machine Learning·7月2日·★★★★

計算リソース制約下での推論におけるリスク管理：コンフォーマル思考

Apple Machine Learning は、大規模言語モデルの推論において、トークン予算と適応的推論の閾値設定をリスク制御問題として再定義する「コンフォーマル思考」手法を発表した。これにより、計算リソースの制約下で信頼性と精度のトレードオフを最適化するアプローチが示された。

Apple Machine Learning·7月2日·★★★★

拡散言語モデルにおけるアンマスキングポリシーの学習

Apple Machine Learning は、拡散型大規模言語モデル（dLLMs）の推論効率を高めるため、トークンのアンマスキング順序を決定する新しい学習手法を提案した。これにより、サンプル品質と処理速度の向上が期待される。

Apple Machine Learning·7月2日·★★★★

MemoryLLM：トランスフォーマー向けのプラグ・アンド・プレイ型解釈可能なフィードフォワードメモリ

Apple Machine Learning は、トランスフォーマーの構成要素を解明する研究の一環として、フィードフォワードモジュールと自己注意機構を分離し、文脈に依存しないトークンごとのニューラル検索メモリを実現する「MemoryLLM」を発表した。

Apple Machine Learning·7月2日·★★★★

VideoFlexTok：柔軟な長さの粗から細への動画トークン化手法

Apple Machine Learning は、動画を時空間グリッドで表現する既存手法を改善し、柔軟な長さに適応できる粗から細への動画トークン化技術「VideoFlexTok」を発表した。

Apple Machine Learning·7月2日·★★★★

学習されたサポート関数を用いた最大内積探索の費用平準化

Apple Machine Learning は、既知の分布から得られるクエリに対して固定データベース内のベクトルを効率的に検索する手法として、ニューラルネットワークで直接解を予測する回帰ベースのアプローチ「Amortized MIPS」を提案した。

Apple Machine Learning·7月2日·★★★★

強化学習微調整済み視覚言語モデルの頑健性と思考連鎖の一貫性に関する研究

Apple Machine Learning は、強化学習で微調整した視覚言語モデルが、誤ったキャプションや思考連鎖の痕跡といった単純なテキスト摂動に対して脆弱であることを示し、視覚的根拠の弱さやハルシネーションの問題を明らかにしました。

Apple Machine Learning·7月2日·★★★★

扱い可能な軌道制御による構造化推論の学習

Apple Machine Learning は、大規模言語モデルが複雑な推論軌道を効率的に獲得できるよう、特定の推論パターンを体系的に発見・強化する「構造化推論」のパラダイムを提案した。

Apple Machine Learning·7月2日·★★★★

評価指標に依存する注釈飽和：ラベル分布からの学習における研究

Apple Machine Learning は、注釈者の不一致が信号となり得ることを示し、評価指標によって必要な注釈者数が異なる「注釈飽和」を特定した。NLI モデルの実験により、不一致を検出するエントロピー相関には約 20〜50 人の注釈者が必要であることが明らかになった。

Apple Machine Learning·6月23日·★★★★

VSAS-Bench：リアルタイム評価のための視覚ストリーミングアシスタントモデルのベンチマーク

Apple Machine Learning は、リアルタイム視覚アシスタントモデルの評価手法として、応答のタイミングや一貫性を測定する「VSAS-Bench」を発表した。既存のオフライン評価とは異なり、ストリーミング環境での性能を多角的に検証する新しい基準を提供する。

Apple Machine Learning·5月22日·★★★★

BalCapRL：強化学習に基づく多モーダル大規模言語モデルの画像キャプション作成のためのバランス型フレームワーク

研究者らは、既存の評価指標が特定の品質に偏りトレードオフを生む課題を解決するため、詳細かつ正確な画像キャプション生成を実現する新しい強化学習ベースのバランス型フレームワーク「BalCapRL」を発表した。

Apple Machine Learning·5月11日·★★★★

マルチビュー撮影から大規模高品質 3D ガウス頭部再構築手法「HeadsUp」を提案

研究者らは、多数のカメラからの入力画像を圧縮し、中性頭部テンプレートに固定された UV パラメータ化された 3D ガウシアンとして復元するスケーラブルなフィードフォワード手法「HeadsUp」を発表した。この手法は、入力画像の数や解像度に関わらず 3D ガウシアンの数を独立させられる。

Apple Machine Learning·5月8日·★★★★

テキスト条件付き JEPA：意味豊かな視覚表現を学習する手法

研究者らは、マスクされた位置の視覚的不確実性を軽減するため、画像キャプションを活用した「Text-Conditional JEPA（TC-JEPA）」を提案し、より意味豊かな視覚表現の学習を実現しました。

Apple Machine Learning·5月7日·★★★★

実用的な学習型画像圧縮において重要なのは何か

研究者らは、人間の視覚系に最適化された実用的な画像コーデックの設計における重要なモデル選択を包括的に研究し、知覚品質と実行時間の両立を目指す。

Apple Machine Learning·5月7日·★★★★

SpecMD：予測的専門家プリフェッチングに関する包括的研究

研究者らは、Mixture-of-Experts モデルの性能向上に不可欠な専門家のキャッシュ機構について、既存のハードウェア中心の方策との相互作用を解明するため、標準化された研究手法「SpecMD」を開発した。

Apple Machine Learning·5月6日·★★★★

反復的ノイズ除去を備えた正規化フローの定式化

研究者が、画像生成モデルの性能向上を目指すため、拡散モデルとは異なる完全なエンドツーエンド方式を採用した「iTARFlow」という新しい手法を開発しました。

Apple Machine Learning·5月6日·★★★★

確率的 KV ルーティング：適応型深層別キャッシュ共有を実現

研究者らは、トランスフォーマー言語モデルの推論コスト削減のため、時間軸以外の「深さ」次元に焦点を当てた新しい手法「確率的 KV ルーティング」を提案し、キーバリューキャッシュのメモリ使用量を大幅に削減できることを示した。

Apple Machine Learning·5月5日·★★★★

PORTool：多ツール統合推論における報酬付きツリーを用いた重要度認識型方策最適化手法

研究チームは、大規模言語モデル（LLM）を活用したエージェントの訓練において、成果のみによる報酬では中間ステップの評価が曖昧になる課題を解決するため、重要度を考慮しツール使用能力を強化する新アルゴリズム「PORTool」を発表しました。

Apple Machine Learning·5月4日·★★★★

正規化フローを用いたエンドツーエンド動画生成モデル「STARFlow-V」の発表

研究チームは、計算コストが高い動画生成領域において拡散モデルに代わる手法として、正規化フローに基づく新しい動画生成モデル「STARFlow-V」を発表した。

Apple Machine Learning·4月30日·★★★★

手話モデルを用いた手話注釈の自己開始的生成手法

研究者らは、高品質な手話データ不足という課題に対し、動画と英語を入力として候補注釈を自動生成する疑似注釈パイプラインを開発した。これにより、コストのかかる大規模注釈作業を軽減し、未利用のデータを活用可能にする。

Apple Machine Learning·4月30日·★★★★

バイアス軽減のための直接ステアリング最適化（DSO）手法の提案

生成モデルが視覚障害者支援などで意思決定を行う際、入力画像の人種や性別などの属性に依存したバイアスが結果に影響を与える問題がある。この研究では、性能低下を最小限に抑えつつバイアスを軽減する「直接ステアリング最適化（DSO）」手法を提案し、ユーザーのニーズに応じたバランス調整を実現する。

Apple Machine Learning·4月29日·★★★★

適応的思考：大規模言語モデルは潜在空間での思考の必要性を認識している

研究チームは、推論時の計算コスト最適化に向け、クエリの複雑度に応じて大規模言語モデルが潜在的な思考（中間推論）を行うタイミングを自己一貫性手法で制御する新アプローチを発表した。

Apple Machine Learning·4月29日·★★★★

LaDiR：潜在拡散がLLMのテキスト推論能力を強化

アント・リンボーは、連続的な潜在表現の表現力と反復的修正機能を統合した新規推論フレームワークLaDiRを提案。この手法は、LLMの連鎖的思考生成における限界を克服し、より効率的かつ多様な解決策の探索を可能にする。

Apple Machine Learning·4月28日·★★★★

StereoFoley：映像から物体認識型ステレオ音声を生成するフレームワーク

研究者らは、映像から意味的に整合し時間同期された空間正確なステレオ音声を 48kHz で生成する「StereoFoley」というフレームワークを発表した。既存モデルがモノラルに限定される中、この手法は物体認識に基づく立体音像を実現する。

Apple Machine Learning·4月28日·★★★★

条件付き拡散モデルにおける構成的一般化の局所的メカニズム

研究者らは、訓練時に経験していないオブジェクト数を持つ画像生成能力（長さ一般化）について、制御された環境で検証した。その結果、場合によっては達成可能だが常に成功するわけではないことが示され、この能力の背後にあるメカニズムが不明確であることが確認された。

Apple Machine Learning·4月28日

ParaRNN：並列学習可能な大規模非線形RNN

アップル研究所は、RNNの並列学習手法「ParaRNN」を開発し、数十億パラメータ規模の大規模RNN学習を初めて可能にした。これにより推論効率の高いモデル設計の選択肢が広がった。

Apple Machine Learning·4月23日·★★★★

「大規模言語モデルは文脈を理解できるか？」

著者たちは、大規模言語モデル（LLM）の文脈理解能力を評価する新たなベンチマークを作成し、既存データセットを基に提示した。

Apple Machine Learning·4月21日·★★★★

モデルのロジットは何を保持しているのか？（答えは驚くべきものかもしれない！）

研究者はビジョン言語モデルを用い、内部ロジットから生成出力へ圧縮される過程で保持される情報の違いを比較した。これにより、モデル所有者が想定しない情報がユーザーに漏洩するリスクを明らかにした。

Apple Machine Learning·4月20日·★★★★

サブサンプリングとランダム割り当てにおける効率的なプライバシー損失計算

著者らは、tステップ中からkステップをランダムに選択するサンプリング手法のプライバシー増幅特性を検討し、差分学習やプライベート集約において標準手法より有用性が高いことを示した。

Apple Machine Learning·4月13日·★★★★

無限へと向かう：ツール利用が状態空間モデルの長さ一般化を可能にする

研究者らは、状態空間モデル（SSM）が理論的に「真に長文」生成問題を正確に解決できないことを示したが、ツール利用によってこの制限を克服し長さ一般化を実現できると報告した。

Apple Machine Learning·3月27日·★★★★

Athena: LLMを用いた反復的足場付きアプリ生成のための中間表現

研究チームが、大規模言語モデル(LLM)による完全なユーザーインターフェース生成の課題を解決するため、複数ファイル間の関係を管理する中間表現「Athena」を開発した。

Apple Machine Learning·3月27日·★★★★

GenCtrl -- 生成モデルのための形式的制御可能性ツールキット

研究者らは、生成モデルの制御可能性を理論的に評価する枠組みを提案し、人間とモデルの相互作用を制御プロセスとして捉えた新アルゴリズムを開発した。

Apple Machine Learning·3月6日

知性と判断の分離不可能性：AIアライメントのためのフィルタリングの計算論的困難性について

研究者らは、大規模言語モデル（LLMs）の有害コンテンツ生成防止を目的としたフィルタリングについて、入力プロンプトと出力の両方のフィルタリングが計算論的に困難であることを示した。

Apple Machine Learning·3月3日·★★★★