#大規模言語モデルのAIニュース

105件の記事

Googleの新GeminiアップデートでChatGPTとClaudeのメモリを簡単にインポート可能に

GoogleとAnthropicは、ChatGPTのユーザーを引き込むため、保存されたユーザーデータをエクスポートする簡単なプロンプトトリックを提供している。

The Decoder·3月28日

Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに

Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。

The Decoder·3月28日·★★★★

Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額

Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。

AI Business·3月27日·★★★★

GLM-5.1が全Coding Planユーザーに開放

智譜がGLM-5.1をGLM Coding Planの全ユーザー（Lite/Pro/Max）に開放した。

智谱·3月27日

AppleがGeminiに完全アクセスを獲得、蒸留技術で軽量オンデバイスAIを構築

AppleはGoogleのGeminiにアクセスし、蒸留技術でSiriやデバイス向けの小型AIモデルを開発している。中国AI企業が秘密裏に行っているとされる手法を採用している。

The Decoder·3月27日·★★★★

AIによるAI研究の実現へ：AIサイエンティスト論文がNature誌に掲載

AIサイエンティストが科学的ブレイクスルーを自律的に探索する研究論文がNature誌に掲載された。

Sakana AI·3月26日·★★★★

OpenAI CEO サム・アルトマン、経済を「本当に加速できる」非常に強力な新モデルを内部で示唆

OpenAIのサム・アルトマンCEOが、次世代AIモデル「Spud」の事前学習を完了し、経済を「本当に加速できる」非常に強力なモデルであると内部で示唆した。

The Decoder·3月25日·★★★★

独占的自己注意（XSA）の独自紹介

研究者はTransformerの自己注意を改良した「独占的自己注意（XSA）」を発表した。これはトークン自身の情報を除外し、直交する情報のみに焦点を当てる手法で、最大27億パラメータのモデルにおいて言語モデリング性能を向上させる。

Apple Machine Learning·3月25日·★★★★

Amazon BedrockにおけるClaudeツール使用によるカスタムエンティティ認識の高速化

Amazonは、AWSのBedrockプラットフォームでClaudeのツール使用機能を活用し、非構造化データからカスタムエンティティを効率的に抽出するソリューションを発表した。

AWS Machine Learning Blog·3月25日·★★★★

ゴルディロックスRL：推論のためのスパース報酬から脱却するためのタスク難易度調整

研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。

Apple Machine Learning·3月18日·★★★★

MIT-IBM Watson AI Lab、若手教員の影響力を増幅する「seed to signal」プログラム

MIT-IBM Watson AI Labは、若手教員が研究チームを構築し、革新的なAI研究の方向性を確立するための支援プログラム「seed to signal」を実施している。

MIT ML News·3月18日

P-GenRM：パーソナライズされた生成報酬モデルが多様な個人嗜好に対応

通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM（Personalized Generative Reward Model）を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。

通义大模型·3月17日·★★★★

次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介

NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。

NVIDIA Developer Blog·3月17日·★★★★

NVIDIA Vera Rubin POD：7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター

NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。

NVIDIA Developer Blog·3月17日·★★★★

メタ、AI投資の費用相殺のため従業員の最大20％削減を計画と報道

メタは、6000億ドル規模のAI投資の費用を相殺するため、従業員の最大20％を削減する大規模なレイオフを計画していると報じられた。

The Decoder·3月14日·★★★★

mAceReason-Math：RLVR対応の高品質多言語数学問題データセット

研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習（RLVR）の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。

Apple Machine Learning·3月13日·★★★★

Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立

xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。

The Decoder·3月13日

Googleは過去のニュース報道とAIを活用して鉄砲水を予測

Googleは、大規模言語モデルを用いて質的な報道を定量的データに変換し、データ不足を解消する新手法で鉄砲水予測を開発した。

TechCrunch AI·3月12日·★★★★

Wayfair、OpenAIを活用してカタログ精度とサポート速度を向上

WayfairはOpenAIのモデルを活用し、eコマースサポートの自動化と数百万の製品属性の精度向上を実現した。

OpenAI News·3月11日

GoogleがChromeにGeminiをインドで導入

GoogleがChromeブラウザにGemini AIをインドで展開し、ヒンディー語やベンガル語など複数のインド言語をサポートする。

TechCrunch AI·3月11日

トークンを流し続ける：16のオープンソースRLライブラリからの教訓

研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。

Hugging Face Blog·3月10日·★★★★

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

ユリシーズ・シーケンス並列処理：100万トークンのコンテキストでのトレーニング

研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。

Hugging Face Blog·3月9日·★★★★

ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに

ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。

The Decoder·3月7日·★★★★

アリババのAI開発責任者が退社、主要チームメンバーも同行

アリババのAI開発責任者Junyang Linが突然退社し、Qwenチームの複数の主要メンバーも同行した。退社は内部組織再編が引き金となったと報じられている。

The Decoder·3月5日

GPT-5.4の紹介

OpenAIが、プロフェッショナル向けに最も高性能で効率的なフロンティアモデル「GPT-5.4」を発表した。最新のコーディング、コンピュータ使用、ツール検索機能と100万トークンのコンテキストを備えている。

OpenAI News·3月5日·★★★★

ペンタゴンとの対立にもかかわらず、Anthropicが200億ドルの年間収益規模に迫る

Bloombergによると、Anthropicは現在の業績に基づき年間約200億ドルの収益を生み出す軌道にある。

The Decoder·3月4日·★★★★

アリババのQwen技術リーダーが主要AI推進後に退任

アリババのQwenチームは、主要モデル発表後に技術リーダーのJunyang Linが退任したことで反響が広がった。

TechCrunch AI·3月4日

NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築

NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。

NVIDIA Developer Blog·3月1日·★★★★

ChatGPTの週間アクティブユーザー数が9億人に到達

OpenAIが、1,100億ドルの私募資金調達を発表し、ChatGPTの週間アクティブユーザー数が9億人に達したことを明らかにした。

TechCrunch AI·2月28日·★★★★

NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発

Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。

NVIDIA Developer Blog·2月28日·★★★★

ダリオ・アモデイ氏による国防総省との協議に関する声明

ダリオ・アモデイ氏が、自社と米国国防総省との協議について声明を発表した。具体的な内容は明らかにされていないが、AI企業と政府機関の連携に関する動向を示している。

Anthropic News·2月26日·★★★★

AI投資家の忠誠心は（ほぼ）死んだ：少なくとも12のOpenAIベンチャーキャピタルがAnthropicも支援

複数のVCがOpenAIと競合するAnthropicの両方に出資しており、従来の利益相反ルールが無視されている状況を示している。

TechCrunch AI·2月24日·★★★★

GoogleのクラウドAI責任者が語る、モデル能力の3つのフロンティア

AIモデルは、知性、応答速度、拡張性の3つのフロンティアで同時に進化を続けている。

TechCrunch AI·2月24日·★★★★

NVFP4低精度モデルトレーニングによる精度を損なわない高スループットの実現

NVIDIAのNVFP4低精度トレーニング技術は、モデルの精度を維持しながら計算スループットを向上させ、AI開発の効率化とコスト削減に貢献する。

NVIDIA Developer Blog·2月24日·★★★★

2026年2月23日アライメントペルソナ選択モデル

2026年2月23日に発表された、AIのペルソナ選択モデルに関するアライメント（整合性）の研究についての記事。

Anthropic Research·2月23日·★★★★

初の証明提出

AIモデルが数学チャレンジ「First Proof」に挑戦した証明を公開。専門家レベルの問題で研究水準の推論能力をテスト。

OpenAI News·2月20日·★★★★

検索拡張生成と多目的アライメントによるクエリ自動補完におけるランキングと生成の統合

クエリ自動補完の課題を解決するため、検索拡張生成と多目的アライメントを用いてランキングと生成を統合する新手法を提案。

Apple Machine Learning·2月18日·★★★★

LWiAIポッドキャスト #234 - Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5

AI技術の最新動向を紹介するポッドキャスト。Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5などの新モデルやアップデートについて議論。

Last Week in AI·2月17日·★★★★

Anthropic CEOダリオ・アモデイインタビュー：指数関数的成長の終点に近づいている

AnthropicのCEOダリオ・アモデイが、同社の年収が10倍増加し、300億円を調達し、評価額が3.8兆円に達したが、OpenAIのように計算資源に全力を注ぐことは避けていると述べた。方向性の予測は容易だが、時期の予測はほぼ不可能であり、1年の誤りで破綻する可能性があるためである。

宝玉的分享·2月14日·★★★★

Anthropicが3800億ドルの評価額でGシリーズ資金調達300億ドルを実施

AI企業AnthropicがGシリーズで300億ドルを調達し、調達後の企業価値は3800億ドルに達した。

Anthropic News·2月12日·★★★★★

NVFP4がAIトレーニングと推論を加速する3つの方法

NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。

NVIDIA Developer Blog·2月7日·★★★★

xAIが200億ドルのシリーズE資金調達を実施

xAI社が200億ドルのシリーズE資金調達を完了し、高度なAI開発の進捗を加速させている。

xAI News·1月6日

AI週間ニュース #327 - Gemini 3、Opus 4.5、Nano Banana Pro、GPT-5.1-Codex-Max

Googleは新モデル「Gemini 3」を公開し、コーディングアプリと記録的なベンチマークスコアを示した。この発表によりAlphabetの株価が上昇し、AIによる成長で4兆ドル規模の評価額へ向かっている。

Last Week in AI·11月26日·★★★★

サウジアラビアとHUMAINとの画期的な提携を発表

GrokがサウジアラビアとHUMAINと提携し、グローバル展開を進めている。

xAI News·11月19日

後悔のないLoRA

John Schulmanらによる、LoRA（Low-Rank Adaptation）の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。

Thinking Machines Lab·9月29日·★★★★

Gemini APIで利用可能なGemini 2.5 FlashおよびPro、Live API、Veo 2

GoogleがGemini APIでGemini 2.5 FlashとProモデル、リアルタイム処理のLive API、動画生成モデルVeo 2を提供開始した。

Google Developers JP·4月10日·★★★★

Grok 3 ベータ版 — 推論エージェントの時代

xAI社が、高度な推論能力と大規模事前学習知識を融合させた最先端モデル「Grok 3」の早期プレビューを発表した。

xAI News·2月19日

憲法分類器：普遍的なジェイルブレイクに対する防御

Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。

Anthropic Research·2月3日·★★★★

社D、生き残っています

平日フルタイム勤務の社会人が、業後・休日に博士課程や連携研究を始めて半年。具体的な成果を紹介する。

Mirai Translate Tech Blog·12月23日

← 前へ2 / 3次へ →

#大規模言語モデル のAIニュース