Microsoft Research の最新記事

公式

30件の記事

AI の委任と長期信頼性に関する研究への追加ノート

Microsoft Research は、最近の論文「LLM が委任時に文書を破損する」について、AI システムの信頼性に関する議論を踏まえ、同研究が主張する点と主張しない点を明確にしている。この研究は、長期にわたる委任・共同作業タスクに対する堅牢な評価手法の開発を目指している。

Microsoft Research·5月16日·★★★★

mimalloc：現代向けの高パフォーマンス・スケーラブルなメモリアロケータ

マイクロソフト研究所が、大規模言語モデルなど高並列・大容量メモリーを扱う現代のサービス向けに、malloc の代替となるオープンソースの高速メモリ管理ライブラリ「mimalloc」を発表した。

Microsoft Research·5月14日·★★★★

GridSFM：電力系統向けに新登場した軽量基盤モデル

マイクロソフトは、交流最適潮流計算をミリ秒単位で予測する小型基盤モデル「GridSFM」を発表し、電力系統分析の効率向上と年間最大200億ドルのコスト削減を実現する。

Microsoft Research·5月14日·★★★★★

MatterSim を用いた材料開発の進展：実験的合成と高速シミュレーション、マルチタスクモデル

マイクロソフト・リサーチは、AI シミュレーションツール「MatterSim-v1」を用いて高温伝導体候補である四角錐形リン化タンタルを特定し、実際に実験的に合成して熱伝導率を測定した。この成果により、材料探索プロセスが大幅に加速された。

Microsoft Research·5月12日·★★★★

SocialReasoning-Bench：AI エージェントがユーザーの利益のために行動できるかを測定するベンチマーク

マイクロソフト研究所は、AI エージェントがユーザーの代わりに交渉や対話を行う際に必要な社会的推論能力を評価する「SocialReasoning-Bench」を発表した。このベンチマークは、2 つの実用的なシナリオにおいて、エージェントがユーザーの最善の利益のために行動できるかをテストするものである。

Microsoft Research·5月12日·★★★★

公開データから大規模な現実的な電力送電網データの構築：パイプラインの紹介

マイクロソフト研究所は、公開データを基に地理的・電気的に整合性のある電力網モデルを構築し、48州および複数州間の接続を含む大規模データセットを公開した。このモデルは物理ベースの混雑や容量分析を可能にする。

Microsoft Research·5月9日·★★★★

NSDI 2026におけるマイクロソフトの大規模ネットワークシステムに関する進展発表

マイクロソフトは、クラウドコンピューティングやAIを支える大規模ネットワークシステムの設計・運用に関する新研究と技術的進展を、USENIXシンポジウム「NSDI 2026」で発表した。

Microsoft Research·5月6日·★★★★

AutoAdapt：大規模言語モデルの自動ドメイン適応

Microsoft Researchは「AutoAdapt」を開発した。大規模言語モデルの専門ドメイン適応を自動化し、計画立案や戦略選択（RAG等）、調整を構造化グラフで自動実行する。適応の高速化と再現性向上を実現した。

Microsoft Research·4月23日·★★★★

「AIを活用してより持続可能な世界を実現できるか？」

Microsoft Researchのダグ・バーガー氏と専門家らは、持続可能な未来の実現に向け、技術者や政策担当者が直面する複雑なAI課題を議論し、AI移行を正の成果とする共通理解の醸成を目指している。

Microsoft Research·4月21日

新しい働き方の未来：AIが急速な変化を推進し、不均等な利益をもたらす

マイクロソフトの研究によると、AIは職場で急速な変化を推進しており、単に作業を速くするだけでなく、人々の協働方法を変えている。AIを協働パートナーとして扱う組織が最大の利益を得ている。

Microsoft Research·4月10日·★★★★

アイデア：望ましい仕事の未来へAIを導く

マイクロソフトの研究者が、2020年から「新たな仕事の未来」研究イニシアチブを通じて、人々の働き方に関する研究を実施・分析し、AI技術が人間に与えるポジティブな影響について議論している。

Microsoft Research·4月10日·★★★★

ADeLe: AIのタスク横断的性能予測と説明

マイクロソフトの研究チームが、AIモデルの18の核心能力を評価し、タスク要求とモデル能力を直接比較できるADeLeを開発した。この手法は新規タスクでの性能を約8%の誤差で予測できる。

Microsoft Research·4月2日·★★★★

AsgardBench: 視覚に基づく対話型計画のためのベンチマーク

マイクロソフトが、視覚的フィードバックに基づいて計画を修正できるAIエージェントを評価するベンチマーク「AsgardBench」を発表した。12種類のタスクで108の制御されたタスクインスタンスを対象とする。

Microsoft Research·3月27日·★★★★

GroundedPlanBench: ロボット操作のための空間的に接地された長期タスク計画

Microsoftの研究チームは、VLMベースのロボット計画モデルが複雑な長期タスクで直面する曖昧性問題を評価するGroundedPlanBenchを開発した。このベンチマークは、モデルが多様な実世界シナリオで行動とその発生場所を計画できるかを測定する。

Microsoft Research·3月27日·★★★★

機械はいつか知能を持つのか？

マイクロソフトリサーチのダグ・バーガーら専門家が、技術者・政策立案者・企業関係者向けに、AI移行を前向きに進めるための共通理解を深める取り組みを紹介している。

Microsoft Research·3月24日

AIエージェントの体系的デバッグ：AgentRxフレームワークの紹介

マイクロソフトが、長く確率的で多エージェントの軌跡により根本原因が埋もれるAIエージェントのデバッグ問題に対し、ツールスキーマとドメインポリシーから制約を合成し最初の回復不能ステップを特定するAgentRxフレームワークを発表した。

Microsoft Research·3月13日·★★★★

生の相互作用から再利用可能な知識へ：AIエージェントのメモリ再考

マイクロソフトが、AIエージェントのメモリ問題を解決する「PlugMem」を発表した。現在のAIエージェントは長い対話履歴を保存するが再利用が困難で、生のメモリ検索は長く価値の低い文脈でエージェントを圧倒する。PlugMemは対話履歴を構造化された再利用可能な知識に変換し、単一の汎用メモリモジュールで多様なエージェントベンチマークの性能を向上させる。

Microsoft Research·3月11日·★★★★

Phi-4-reasoning-visionとマルチモーダル推論モデル訓練の教訓

マイクロソフトは、Phi-4-reasoning-vision-15Bというコンパクトで効率的なマルチモーダル推論モデルを開発し、視覚言語タスクや数学・科学推論に優れる性能を実現した。同社はその訓練プロセスから得られた教訓を共有している。

Microsoft Research·3月5日·★★★★

予告編：来たるべきものの形

マイクロソフトの研究リーダー、ダグ・バーガーと各分野の専門家が、技術者や政策立案者などが直面するAIの最も困難な問題について議論し、AI移行が純利益となる未来を築くための共通理解を深めることを目指している。

Microsoft Research·3月3日

CORPGENが実務向けAIエージェントを進化させる

CORPGENは、複数の相互依存タスクを同時管理する「Multi-Horizon Task Environments（MHTEs）」を開発した。現在のAIエージェントは多タスク負荷で完了率が16.7%から8.7%に急低下する課題を解決する取り組み。

Microsoft Research·2月27日·★★★★

実践におけるメディア真正性手法：能力、限界、方向性

合成メディアの増加に伴い、コンテンツの真偽と出所の検証が重要になっています。本報告では、画像・音声・動画の真正性確認手法とその限界、信頼できる出所追跡への実践的アプローチを探ります。

Microsoft Research·2月20日·★★★★

プロジェクトシリカのガラスストレージ技術における進展

プロジェクトシリカがボロシリケートガラスへのデータ記録技術を進化させ、コスト削減とシステム簡素化を実現。1万年のデータ保存を可能にする。

Microsoft Research·2月19日·★★★★

予測的逆動力学モデルによる模倣学習の再考

予測的逆動力学モデルは、次の状態を予測することで曖昧さを減らし、少ないデモンストレーションで標準的な行動模倣を上回る性能を発揮する理由を探る研究。

Microsoft Research·2月6日

Paza: 低リソース言語のための自動音声認識ベンチマークとモデルの紹介

Microsoft Researchが、低リソース言語向けの人間中心の音声パイプライン「Paza」と初のリーダーボード「PazaBench」を発表。39のアフリカ言語と52のモデルをカバーし、実環境でコミュニティと共にテスト。

Microsoft Research·2月5日

UniRG：マルチモーダル強化学習による医療画像レポート生成のスケーリング

UniRGは強化学習を用いて、異なる報告様式に対応した医療画像レポート生成AIの性能を向上させる手法です。

Microsoft Research·1月28日·★★★★

AIエージェント向け、アジェンティック・ベリファイアを用いたマルチモーダル強化学習

Microsoft Researchチームは、医療画像レポート生成をスケーリングする「UniRG」を開発し、マルチモーダル強化学習とエージェント型検証機能を用いて精度を向上させた。

Microsoft Research·1月21日·★★★★

OptiMind：最適化専門の小型言語モデル

Microsoft Researchは最適化専門の小型言語モデル「OptiMind」を開発し、新手法で大小規模言語モデルの推論性能を向上させた。

Microsoft Research·1月15日·★★★★

Agent Lightning：AIエージェントに強化学習をコード書き換えなしで追加

Microsoft Researchは「Agent Lightning」を開発し、AIエージェントに強化学習をコード書き換えなしで適用する手法を提供した。

Microsoft Research·12月12日·★★★★

プロンプションズ、動的UIコントロールでAIプロンプトの精度を向上させる

開発チームは「Promotions」UIフレームワークを公開し、ユーザーがAI応答を動的に制御できるインターフェースを提供する。これにより顧客支援や教育などでプロンプト試行錯誤を削減できる。

Microsoft Research·12月11日·★★★★

GigaTIME：マルチモーダルAIが生成する仮想患者集団を用いた腫瘍微小環境モデルの大規模化

研究チームは、マルチモーダルAIで生成した仮想患者集団を用い、腫瘍微小環境の相互作用を解明する大規模モデルを構築した。

Microsoft Research·12月10日·★★★★★