メインコンテンツへスキップ

#llm のAIニュース

1829件の記事

[AINews] GLM は GPT より優れているか?GLM-5.2 が実用性を証明、Z.ai が 12 月までに「Open Fable」を公開予定

Latent Space のニュースでは、中国のモデル「GLM-5.2」がベンチマークで優れた結果を示し実用性があると評価されたことと、Z.ai が 12 月までにオープンソースプロジェクト「Open Fable」を発表する見込みについて報じられています。

Latent Space·6月19日·★★★★

Salesforce CodeGen チュートリアル:ユニットテストと安全性チェック付きの Python 関数の生成・検証・再ランク付け

Salesforce は Hugging Face からモデルを読み込み、自然言語から Python 関数を生成するエンドツーエンドワークフローを公開した。この手法には構文チェックや静的解析、ユニットテストによる検証が含まれる。

MarkTechPost·6月19日

OpenAI が企業向け利用分析機能を導入(3 分読了)

OpenAI は、企業が自社の AI サービス利用状況を詳細に把握・管理できるよう、新たな企業向け利用分析機能を発表した。

TLDR AI·6月19日·★★★★

MosaicLeaks:研究エージェントは秘密を守れるか?(10 分読了)

TLDR AI は、プライベート文書とウェブ検索を組み合わせる深層研究エージェントのプライバシーリスク「MosaicLeaks」を指摘し、安全なクエリ構築による報酬学習で情報漏洩を大幅に削減する新手法 PA-DR を提案した。

TLDR AI·6月19日·★★★★

OpenAI、次週に GPT-5.6 モデルの公開を準備(2 分読了)

OpenAI は来週、GPT-5.6 のミニ版とプロ版を含む新モデルを発表する予定である。同社は 150 万トークンのコンテキストウィンドウ拡大やコーディング機能の強化、Codex の応答速度向上を主な改善点としており、米国規制の影響で Claude Fable 5 の提供が制限される Anthropic を価格面で下回る戦略を掲げている。

TLDR AI·6月19日·★★★★

GitHub Copilot の Opus 4.6 (fast) モデルが 2026 年 6 月 29 日に廃止予定

GitHub は、Copilot Chat やコード補完など全ての機能で利用可能な「Opus 4.6 (fast)」モデルを 2026 年 6 月 29 日までに廃止すると発表しました。ユーザーは代替モデルである「Opus 4.8 (fast)」への移行が必要です。

GitHub Changelog·6月19日

CloudWatch の SageMaker メトリクスとインサイトダッシュボードを用いた生成 AI 推論の監視・デバッグ

AWS は、大規模な生成 AI 推論エンドポイントの P99 レイテンシ急上昇などのトラブルを GPU メモリ圧力や KV キャッシュ飽和などから特定できるよう、CloudWatch に SageMaker の詳細メトリクスとインサイトダッシュボードを追加した。

AWS Machine Learning Blog·6月19日·★★★★

Microsoft の小規模コーディングモデル「MAI-Code-1-Flash」が GitHub Copilot の利用範囲を拡大

マイクロソフトは、小規模コーディングモデル「MAI-Code-1-Flash」の利用可能領域を拡張し、Copilot CLI、GitHub Mobile、Visual Studio などの主要な開発環境で利用可能になったと発表した。

GitHub Changelog·6月19日·★★★★

Copilot コードレビュー:AGENTS.md サポートと UI 改善

GitHub Copilot がリポジトリレベルの AGENTS.md ファイルをサポートし、ドラフトプルリクエストからのレビュー依頼が容易になりました。これにより、開発者がレビューフィードバックをより効果的に制御できるようになります。

GitHub Changelog·6月19日·★★★★

Claude Code の操作:CLAUDE.md ファイル、スキル、フック、ルール、サブエージェントなど

Anthropic は Claude Code の制御機能を強化し、設定ファイルや自動化機能の拡張を発表した。

Claude Blog·6月19日·★★★★

MosaicLeaks:研究エージェントは秘密を守れるか?

Hugging Face は、AI エージェントが機密情報を漏洩するリスクを検証する「MosaicLeaks」という評価フレームワークを発表した。

Hugging Face Blog·6月19日·★★★★

独自の脆弱性ハーンを構築する

クラウドフレアは、最先端セキュリティモデルを企業コードベースに適用した「グラスウィング・プロジェクト」の初期調査結果を発表し、AI 脅威からインフラと顧客を守るための防御構造の適応について解説している。

Cloudflare Blog·6月19日·★★★★

Google ドキュメントから AI 機能をオフにする方法

Google が提供するドキュメント作成ツール「Google ドキュメント」において、ユーザーが組み込みの AI 機能(Gemini など)を無効化して利用する方法を解説している。

TechCrunch AI·6月19日

AI が意識を持つなら『エイジ・オブ・エンパイアーズ II』もそうなる

SF作家のテッド・チャンは、大規模言語モデルに意識があるとする考え方が不合理であることを示すために、『エイジ・オブ・エンパイアーズ II』のようなゲームやマイクロソフトワードにも同様の可能性を認めるべきだと指摘した。

404 Media·6月18日

AI #173:AIの一時停止

ホワイトハウスが輸出規制を課した結果、トランプ政権によりClaude Fable 5とClaude Mythos 5がシャットダウンされ、アンソロピック社がワシントンで政府と協議している。

The Zvi·6月18日·★★★★

Photoshop と Premiere に AI アシスタントが搭載

Adobe が Creative Cloud の主要アプリに個別の AI アシスタントを公開ベータとして導入し、編集・デザイン業務を支援する機能を展開した。

The Verge AI·6月18日·★★★★

ChatGPT の健康知能の向上について

OpenAI は、ChatGPT が医療分野や健康関連の情報処理においてより正確で有用な回答を提供できるよう機能を強化したと発表した。

OpenAI News·6月18日·★★★★

KV キャッシュ圧縮競争:TurboQuant、OSCAR、EpiCache の比較

MarkTechPost は、長文コンテキストを持つ大規模言語モデルにおけるメモリボトルネックを解消する KV キャッシュ圧縮技術の最新動向について、TurboQuant、OSCAR、EpiCache の各手法を比較分析している。

MarkTechPost·6月18日·★★★★

マイクロソフトが中国で OpenAI モデルを販売、OpenAI と Anthropic は参入せず

マイクロソフトは知的財産や悪用リスクを理由に OpenAI や Anthropic が直接市場に出さない中、中国の大手インターネット企業向けに GPT シリーズモデルの販売を開始し、米国 AI ベンダーとして独自の地位を確立した。

AI News·6月18日·★★★★

Domyn と AISquared が Ai2 のオープンリリースをどう活用したか

Domyn と AISquared は、透明性やライセンス管理が不可欠な規制業界向けに AI モデルを開発する際、Ai2 のオープンソースリリースを活用している。これにより顧客の信頼とコンプライアンス確保を実現している。

Allen AI (AI2)·6月18日·★★★★

今日は何も起こらなかった(GLM-5.2 など新モデル紹介)

智譜(Zhipu)が公開した「GLM-5.2」は、100 万トークンの推論を可能にする革新的なインデックス共有スパースアテンションを採用し、GPT-5.5 や Opus 4.8 に匹敵すると評価された。また、Poolside AI の「Laguna M.1」や Cohere の「North Mini Code」など、長文コーディングやローカル展開に特化した注目すべきオープンモデルも発表された。

Smol AI News·6月18日·★★★★

MCP コネクタの権限管理を一元化

Anthropic は MCP(Model Context Protocol)コネクタに対する権限設定を一元管理する機能を発表した。これにより、複数の接続先におけるアクセス制御を一括で効率的に運用できるようになる。

Claude Blog·6月18日·★★★★

Claude Code がアーティファクト機能をサポート

Anthropic は開発者向けツール「Claude Code」に、コード生成結果を直接表示・編集できる「アーティファクト」機能を追加した。これにより、開発ワークフローの効率化が図られる。

Claude Blog·6月18日·★★★★

ミストラル、今夏に新モデルを発表予定(2 分読了)

AI 企業ミストラルが、今年夏に新たな大規模言語モデルの発表を計画していることを明らかにした。

TLDR AI·6月18日

ノア・シャゼーが OpenAI に合流(1 分読了)

Google を去った AI 研究の先駆者ノア・シャゼーが、OpenAI へ移籍することが発表された。彼は「Attention Is All You Need」論文の共著者として知られる。

TLDR AI·6月18日·★★★★

Claude で Replit が利用可能に(2 分読了)

Anthropic の AI チャットボット「Claude」が、コード開発環境「Replit」との連携機能を正式に追加し、ユーザーは Claude 内で直接 Replit を使用できるようになった。

TLDR AI·6月18日·★★★★

Cursor の新モデル(1 分で読めます)

Cursor が 10 万基以上の GPU でゼロから訓練した、1.5 兆パラメータの超大規模モデルを発表する。このモデルは単なる補完やペアプログラミングを超え、自律的なソフトウェア開発を推進し、コーディング以外の分野でも高度な知能を発揮する。

TLDR AI·6月18日

LoRA を超えるか?最も人気のあるファインチューニング手法に勝てるか

Hugging Face は、現在最も普及しているファインチューニング技術である LoRA の限界を検証し、それを上回る新たな手法の可能性について議論している。

Hugging Face Blog·6月18日·★★★★

ChatGPT の市場シェアが初めて 50% を下回る

OpenAI が開発する ChatGPT の市場シェアが過去に初めて 50% を割り込み、ユーザーは Google Gemini や Anthropic の Claude など他社製アシスタントへ移行している。

TLDR AI·6月18日·★★★★

惑星サイズの脳:LLM は考えすぎなのか?(30 分読了)

TLDR AI が実施した研究では、Claude や GPT の最新モデルを多数組み合わせ、セキュリティ脆弱性の特定実験を行いました。その結果、推論努力を増やしたり新モデルを使ったりしても、必ずしもセキュリティ結果の選別が向上するわけではないことが示されました。

TLDR AI·6月18日·★★★★

エージェント性は十分か?独自ツールを用いたオープンモデルのベンチマーク調査

Hugging Face が、独自に構築したツール環境において、オープンソースモデルがどれほど「エージェント性」を発揮できるかを評価するベンチマーク手法を発表しました。

Hugging Face Blog·6月18日·★★★★

GLM-5.2 はおそらく最も強力なテキスト専用オープンウェイト大規模言語モデルである

中国の AI ラボ Z.ai が、7530億パラメータ(アクティブ400億)を持つテキスト専用モデル「GLM-5.2」を MIT ライセンスで公開した。これは同社が提供するオープンウェイト大規模言語モデルの中で最も強力なものである。

Simon Willison Blog·6月18日·★★★★

Amazon Quick の自律型エージェントで毎日数時間を節約

AWS は、Amazon Quick という AI アシスタントが背景で動作し、業務の自動化や会議準備などを代行することで、ユーザーが重要な優先事項に集中できる機能を発表した。

AWS Machine Learning Blog·6月18日·★★★★

各トークンからより多くを引き出す:Copilot のコンテキスト処理とモデルルーティングの改善方法

GitHub は、Copilot が計画やデバッグなど長期間にわたるエージェントタスクを遂行する際、トークンの使用効率を高めるため、コンテキストの重複削減と用途に応じた適切なモデル選択機能を強化した。

GitHub Blog·6月18日·★★★★

Anthropic、理解不能な輸出規制により影響を受ける

トランプ政権が外国人へのアクセス禁止を突然命じたため、Anthropic は Fable 5 や Mythos 5 の全ユーザー(米国在住者や自社従業員含む)への提供を停止せざるを得ず、同社は数週間かけてモデルの復旧に努めている。

The Verge AI·6月18日·★★★★

"危険"なAIモデルは規制に関係なく登場する

米国政府の輸出管理指令により、アントロピック社は新モデル「Claude Fable 5」と「Mythos 5」の利用を停止した。同社はホワイトハウスと協議中だが、再稼働のための合意はまだ得られていない。

Ars Technica AI·6月18日·★★★★

チャリティ・メイジャーズへの引用:コード生産の経済構造が逆転

Simon Willison は、2025 年にコード生成のコストと時間が劇的に低下し、コードが貴重品から使い捨て可能なものへと変化したと、Charity Majors の指摘を引用して伝えている。

Simon Willison Blog·6月18日·★★★★

Google、スマートホームスピーカーの再発明に Gemini を賭ける

Google は、自社の AI モデル「Gemini」を活用してスマートホームスピーカーを再構築し、従来の音声アシスタントを超える高度な対話機能の実現を目指す。

TechCrunch AI·6月18日·★★★★

GitHub Copilot チャットで全ユーザー向けに自動モデル選択モードが利用可能に

GitHub は、Copilot Chat の新機能として「自動モデル選択」を全プランのユーザーへ一般提供を開始した。この機能はリクエストの複雑さやモデルの可用性に基づき、自動的に最適なモデルを選択し、トークン使用量の最適化と高品質な結果の維持を実現する。

GitHub Changelog·6月18日

Gemini搭載のGoogle Homeスピーカーが6月25日に100ドルで登場

Googleは、約6年ぶりの新スマートスピーカー「Google Home Speaker」を6月25日に発売すると発表した。価格は99.99ドルで、Gemini AIを搭載している。

Ars Technica AI·6月18日

GitHub Copilot の個別プラン登録が再開

GitHub は、学生向けおよび Pro、Pro+、Max プランの新たな登録を今後数週間にわたり順次再開すると発表した。

GitHub Changelog·6月17日

「かつてありし未来の寓話」第 3 部:このコードを修正せよ

Zvi は、主要メディアが世界で最も重要な物語を見逃しているとし、Anthropic がワシントンで行った会議に関する最新情報を得ていないと指摘した。予測市場では、7 月 1 日までの復旧確率が約 55% と推移していると分析している。

The Zvi·6月17日·★★★★

Facebook の投稿を根拠とした AI 検索?何が問題になるか

メタが検索機能に新 AI モードを導入したが、週末の予定など具体的な質問への回答精度に課題があり、誤情報リスクが懸念されている。

The Verge AI·6月17日·★★★★

OpenAI Codex を活用した 5 つの楽しいプロジェクト

KDnuggets が紹介する記事では、OpenAI のコード生成モデル「Codex」を実際に使用して作成された 5 つの興味深いプロジェクト事例が紹介されています。

KDnuggets·6月17日

ミニマックスが109BパラメータMoEモデル向けに開発したスパースアテンション手法「MSA」を発表

中国のAI企業ミニマックスは、長文コンテキストにおける計算コストを削減する新手法「MiniMax Sparse Attention(MSA)」を開発し、109BパラメータのMoEモデルで実証した。同社はさらに推論用カーネルをオープンソース化し、生産環境向けモデル「MiniMax-M3」もリリースした。

MarkTechPost·6月17日·★★★★

[AINews] GLM-5.2:世界最高峰のフロントエンドコーディングモデル、推測型デコーディングのための IndexShare を発表

Z.ai は週末に「GLM-5.2」をリリースし、この新モデルが世界最高のフロントエンドコーディング性能を持つと主張した。また、推測型デコーディング技術の向上を目指す「IndexShare」という仕組みも紹介された。

Latent Space·6月17日·★★★★

修正PRを食べてレビュースキルが向上:Claude Codeによる自己改善サイクル

メルペイ QA チームは、コードレビューの限界に対処するため、Claude Code の機能を活用した自己改善サイクルを導入し、AI が修正 PR を学習することで人間のレビュースキルを向上させる仕組みを実装した。

Mercari Engineering·6月17日·★★★★

PLaMo-3.0-Prime-βをLLM開発現場で活用

Preferred Networksは、自社が開発する大規模言語モデル「PLaMo」の最新版「PLaMo-3.0-Prime-β」を、データ準備や評価、コード管理など開発業務に直接導入し、作業効率と品質向上を図るとともに、モデル自体の継続的な改善を進めている。

Preferred Networks·6月17日·★★★★

パッキングシーケンス、GQA、ALiBi、SwiGLU、因果アテンションを用いたメモリ効率的なTransformerの構築方法(xFormers活用)

MarkTechPost は、GPU上で高速かつメモリ効率の高いTransformerモデルを構築するための実践的ツールキット「xFormers」の使用法を紹介しています。記事では、標準的な実装との比較を通じて、因果マスクやパッキングシーケンス、グループ化クエリアテンション(GQA)、カスタムALiBi位置バイアスなどの技術を組み合わせ、訓練可能なGPTスタイルのモデルを実装する方法を解説します。

MarkTechPost·6月17日·★★★★

Claude Opus 4.8 ビルドデーハッカソンの受賞者発表

Anthropic が開催した「Claude Opus 4.8 ビルドデー」ハッカソンの結果を発表し、優秀なアイデアやプロトタイプを作成した参加者を表彰しました。

Claude Blog·6月17日