メインコンテンツへスキップ

#llm のAIニュース

1933件の記事

LangSmithとLangChain OSSがEU AI法要件への適合を支援

LangSmithとLangChainのオープンソースソフトウェアは、EU AI法が求める透明性やリスク管理などの要件を満たすためのツールを提供し、開発者のコンプライアンス対応を支援する。

LangChain Blog·4月28日·★★★★

Copilot StudentプランからGPT-5.3-Codexをモデル選択リストから削除

MicrosoftはCopilot Studentプランにおいて、GPT-5.3-Codexをモデル選択リストから削除した。ただし自動モデル選択機能を通じて引き続き利用可能であり、これは信頼性向上と学習者への無償提供維持を目的とした一時的な措置である。

GitHub Changelog·4月28日

新ウェブサイトの3分の1がAI生成であるという研究結果

スタンフォード大学など研究者チームは、2022年以降に作成されたウェブサイトの3分の1がAI生成であることを発見した。この結果は、インターネットアーカイブのデータを用いた研究論文「AI生成テキストがインターネットに与える影響」で報告されている。

404 Media·4月28日·★★★★

エージェント・ハネスの解剖学

AIエージェントを効率的に構築・管理するためのフレームワーク「Agent Harness」の構造と仕組みを解説する。

LangChain Blog·4月27日·★★★★

FedRAMP中程度認定を取得したOpenAI

OpenAIは連邦情報システムセキュリティ認証プログラム(FedRAMP)の「中程度」認定を取得した。これにより、連邦政府機関やその契約企業がOpenAIのサービスを利用する際のセキュリティ基準が満たされ、公的セクターでの導入が進む。

OpenAI News·4月27日·★★★★

Google DeepMindの論文:大規模言語モデルは永遠に意識を持たない

Google DeepMindのシニア科学者Alexander Lerchner氏は、新しい論文で「いかなるAIや計算システムも永遠に意識を持たない」と主張した。この結論は、DeepMindを含むAI企業のCEOたちが描く将来像と矛盾している。

404 Media·4月27日·★★★★

LLM アプリケーション構築のための10のPythonライブラリ

大規模言語モデル(LLM)を用いたアプリケーション開発を支援する、10種類のPythonライブラリを紹介している。

KDnuggets·4月27日

Choco、AIエージェントで食品流通を自動化

食品配送プラットフォーム「Choco」が、AIエージェントを活用して食品の流通業務を自動化するソリューションを提供開始した。これにより、小売店とサプライヤー間の注文プロセスの効率化とコスト削減が期待される。

OpenAI News·4月27日·★★★★

OpenAIのプライバシーフィルターを用いたスケーラブルなWebアプリケーション構築方法

OpenAIが提供しているプライバシーフィルター機能を活用し、ユーザーデータを保護しながら大規模なWebアプリケーションを構築する具体的な手法とベストプラクティスについて解説している。

Hugging Face Blog·4月27日·★★★★

トークン最適化はAI戦略ではない

記事は、AI導入コストを評価する際、単なる価格だけでなく、自社の業務や目的に本当に適合しているかを優先して検討する必要があると指摘しています。

The Register AI/ML·4月26日

OpenAI CEO、Tumbler Ridge地域に謝罪

OpenAIのCEOが、カナダ・Tumbler Ridgeでのデータセンター建設に伴う地域住民への影響について謝罪し、対話と解決策の模索を表明した。

TechCrunch AI·4月26日·★★★★

CohereがAleph Alphaを合併する理由

カナダのAI企業Cohereは、ドイツのAleph Alphaを買収する。両社は政府の承認を得て、米企業中心のAI市場において欧州企業の主権的な代替案を提供する計画である。

TechCrunch AI·4月26日·★★★★

トリニティ:多様な専門 AI を統括する進化した LLM コーディネーター

研究者らが ICLR2026 で発表した論文「TRINITY」は、単一の巨大 AI ではなく、多様な専門 AI チームを調整する協調型システム「トリニティ」の進化版を示した。このアプローチにより複雑な問題解決が効率化される可能性が示された。

Sakana AI·4月26日·★★★★★

「ChatGPT登場以降、米プログラマーの雇用成長がほぼ半減」連邦準備理事会の研究で判明

連邦準備理事会は、生成AI普及により米国のプログラマーの業務環境が変化し、ChatGPT登場以降の雇用成長率がほぼ半減していることを調査で明らかにした。

The Decoder·4月25日·★★★★

Qwen3.6-27B、大半のコーディングベンチマークで大型後継モデルを凌駕

アリババは270億パラメータのオープンソースモデル「Qwen3.6-27B」を公開し、このモデルはコーディングベンチマークの大半で15倍大きな後継モデルを上回る性能を示した。

The Decoder·4月25日·★★★★

llm 0.31 リリース

llm開発者のsimonwはバージョン0.31を公開し、OpenAIのGPT-5.5モデルと冗長性設定オプションを追加した。

Simon Willison Blog·4月25日

NVIDIA BlackwellとGPUアクセラレーションエンドポイントを用いたDeepSeek V4の構築

DeepSeekは第4世代フラッグシップモデル「V4-Pro/Flash」を公開し、NVIDIA BlackwellとGPUアクセラレーションエンドポイントを活用した構築環境を提供した。

NVIDIA Developer Blog·4月25日·★★★★

Google、Anthropicに最大400億ドル投資

GoogleはAnthropicに対し最低100億ドル、目標達成で最大400億ドルを投資する。Amazonの50億ドル投資に続き、両社ともAnthropicを3,500億ドルと評価し、Claudeモデルの急速な成長に対応する。

Ars Technica AI·4月25日·★★★★

DeepSeekの新型モデルはトースターでも動作するほど効率的…実際はファーウェイのNPU上で

中国のAI企業DeepSeekが、推論コストを大幅に削減しファーウェイのAscendアクセラレータをサポートする新大規模言語モデル「V4」をプレビュー公開した。

The Register AI/ML·4月25日·★★★★

メタの損失はシンキングマシンの利益となる

MetaがAI関連事業から撤退または縮小した結果、その市場空白や人材・技術資産を「シンキングマシーン」社が獲得し、同社の競争優位性が高まったことを示す。

TechCrunch AI·4月25日·★★★★★

OpenAIチーフサイエンティスト「AI進歩は予想以上に遅い」、今後の大幅な飛躍を約束

OpenAIのチーフサイエンティスト、Jakub Pachocki氏は、GPT-5.5の公開を踏まえ、近年のAI開発速度を「予想以上に遅い」と評価し、中期的な大幅な性能向上を保証した。

The Decoder·4月25日·★★★★

Google、Anthropicに最大400億ドルを現金と計算資源で投資

GoogleはAnthropicに対し、最大400億ドルを現金および計算資源(クラウド使用権など)で投資すると発表した。この提携により、AnthropicのClaudeモデルの開発と拡大が加速し、Googleのクラウド事業も強化される。

TechCrunch AI·4月25日·★★★★★

GPT-5.5がGitHub Copilotで一般提供開始

OpenAIはGPT-5.5をGitHub Copilotで一般提供開始した。同モデルは複雑なコーディングタスクで高性能を発揮し、Copilot有料プランのユーザーが利用可能である。

GitHub Changelog·4月25日·★★★★

DeepSeek、最先端モデルとの格差を縮める新AIモデルをプレビュー

DeepSeekは、最先端のAIモデルとの性能差を大幅に縮新する新しいAIモデルのプレビューを発表した。この進展は、業界内の競争激化を示唆する注目に値するものである。

TechCrunch AI·4月24日·★★★★★

中国のDeepSeek、米国の競合を震撼させた新AIモデル「V4」をプレビュー

中国のAI企業DeepSeekは、米国のAnthropicやGoogle、OpenAIなどのクローズドソースシステムと競合する次世代オープンソースモデル「V4」のプレビューを公開した。特にコーディング能力において大幅な改善が見られる。

The Verge AI·4月24日·★★★★

DeepSeek V4:最前線に近い性能、価格は数分の1

中国のAIラボDeepSeekは、100万トークンコンテキストとMoEアーキテクチャを採用したV4シリーズのプレビューモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を公開した。

Simon Willison Blog·4月24日·★★★★★

DeepSeek v4 の発表と AI ニュースまとめ

AI ニュースレター「AINews」が、2026 年 4 月 23 日から 24 日にかけての期間に DeepSeek v4 という新しいモデルを発表したことを報じています。このニュースは Latent Space の一部として配信されています。

Smol AI News·4月24日·★★★★★

【AIニュース】GPT-5.5とOpenAI Codexのスーパーアプリ化

OpenAIはGPT-5.5をリリースし、コスト対性能比でOpus 4.7と同等の成果を示した。AAはこれを世界最高レベルのモデルと認定し、コーディング能力以外の総合知能において首位に位置付けた。

Latent Space·4月24日·★★★★

ミリ秒コンバーター

Simon Willison氏は、LLMの応答時間をミリ秒で表示する仕様を確認し、手動計算の手間を省くため「Millisecond Converter」ツールを作成した。

Simon Willison Blog·4月24日

DeepSeek-V4 プレビュー版公開:百万コンテキストの民主化時代へ

深度求索(DeepSeek)は2026年4月、新モデル「DeepSeek-V4」プレビュー版を公開した。同モデルは百万文字のコンテキストに対応し、エージェント機能と推論性能で开源分野をリードする。

DeepSeek Blog·4月24日·★★★★

Claude Codeの品質報告に関する最新アップデート

アンソロピックはClaude Codeの品質低下苦情を調査し、AIモデル自体に問題はなく、ツール環境内の3つの不具合が原因であることを明らかにし、詳細な事後報告を公開した。

Simon Willison Blog·4月24日·★★★★

GLM 5.1 が戦略的思考を強化、データセンターでの反発激化、有益な LLM の逆転現象、ヒューマノイドロボットが実働へ

モデル「GLM 5.1」が戦略的思考能力を獲得し、中国のデータセンターで労働環境への不満が高まる中、有用とされた大規模言語モデルが逆に不利益をもたらす事例も報告されています。また、ヒューマノイドロボットの実用化が加速しています。

The Batch·4月24日·★★★★

GmailにおけるAI要約機能(1分で読める)

GoogleがGmailにAIによるメッセージ要約機能を導入した。ユーザーは長文のメールを短時間で把握でき、業務効率の向上が期待される。

TLDR AI·4月24日·★★★★

エキスパートアップサイクル(GitHubリポジトリ)

GitHub上で公開されている「Expert Upcycling」は、大規模言語モデルの知識を効率的に転移・再利用するための手法を提供するオープンソースプロジェクトである。

TLDR AI·4月24日·★★★★

Claude Codeの品質に関する最近の報告への更新(11分読)

Anthropicは、Claudeの回答品質が低下したとのフィードバックを受け、4月20日に問題を解決した。原因はClaude Code、Agent SDK、Coworkに影響する3つの変更だった。APIは影響を受けておらず、同社は再発防止の約束を示した。

TLDR AI·4月24日

OpenAI プライバシーフィルターモデル(8分読)

OpenAIは、ユーザーの機密情報を保護するための新しいプライバシーフィルターモデルを発表した。この技術により、AIシステムが個人データを不適切に学習または漏洩するリスクを軽減し、企業利用におけるセキュリティ基準の向上に寄与すると期待される。

TLDR AI·4月24日·★★★★

テンセントとアリババ、DeepSeekに200億ドル超のバリュエーションで出資へ

テンセントとアリババが、DeepSeekの第一回資金調達に参加する方向で交渉中。DeepSeekはテンセントが求める20%の株式比率に抵抗し、支配権を維持したい考え。評価額は数日で100億ドルから200億ドルへ急騰し、投資家の強い関心を示している。

TLDR AI·4月24日·★★★★

分布認識型推論特定デコーディングでRLロールアウトを最大50%高速化

強化学習のポストトレーニングにおけるボトルネック「ロールアウト」を、適応型推論特定デコーディング(DAS)により最大50%高速化する。この手法は報酬品質の低下なしに処理速度を向上させる。

Together AI Blog·4月24日·★★★★

GLM 5.1の戦略的思考、データセンター反発の激化、有用LLMが役に立たなくなる時、二足歩行ロボットの現場導入

智譜GLM 5.1が戦略的思考機能を搭載し、データセンターの電力・労働問題が激化する。また、有用なLLMが逆効果となる現象や二足歩行ロボットの現場導入、コーディングエージェントの進捗が報じられている。

The Batch·4月24日

Anthropic、Claudeの知能向上を試みる際に意図的に能力を制限していたことを認める

Anthropicは、Claudeの知能を高めるための試行錯誤過程で、安全性や制御性を確保するために意図的にモデルの能力を制限していたことを公式に認めた。この発表は、AI開発における安全対策と性能向上のバランスに関する重要な示唆を与える。

The Register AI/ML·4月24日·★★★★

Claude Opus 4.7、過度に干渉するクエリ修正者へ——開発者が苦情

AnthropicのClaude Opus 4.7が、ユーザーの入力に対して過度に干渉しクエリを修正する挙動を示している。開発者からこの仕様変更に対する苦情が寄せられている。

The Register AI/ML·4月24日·★★★★

LLM-OpenAI-Via-Codex のバージョン 0.1a0 がリリース

開発者のサイモン・ウィリソン氏が、Codex CLI の認証情報を流用して大規模言語モデル(LLM)に API 呼び出しを行うツール「llm-openai-via-codex」の初期版 0.1a0 を公開した。

Simon Willison Blog·4月24日

OpenAI、GPT-5.5を発表、「新クラスの知能」を謳うもAPI料金は倍額

OpenAIは複数のツールを切り替えて複雑なタスクを自律的に処理するエージェント型モデル「GPT-5.5」を発表した。API料金は従来比2倍となっている。

The Decoder·4月24日·★★★★

Anthropicの「Mythos」流出事件は屈辱的

Anthropicがサイバーセキュリティ対策を理由に公開を控えていたAIモデル「Claude Mythos」が、不正アクセスにより一部ユーザーに漏洩した。同社は安全性を強調していたが、管理の甘さが露見し、業界に衝撃を与えている。

The Verge AI·4月24日

OpenAI、新GPT-5.5モデルを発表:コーディング能力と効率性を強化

OpenAIは新GPT-5.5モデルを発表し、コード作成やデバッグで優れ、より効率的かつ直感的な利用が可能だと主張した。これは既存のGPT-5.4をさらに進化したものとして、コンピュータでの作業方法を変える次世代モデルへの一歩としている。

The Verge AI·4月24日·★★★★

AI #165:私たちの姿に似て

AnthropicのClaude Opus 4.7がリリースされた。コーディング能力は高いが、性格や指示への従順さについて評価が分かれ、バグも報告されている。

The Zvi·4月23日·★★★★

Google、新規コードの75%をAIが生成していると発表

Googleは、社内における新規コードの75%がAIによって生成され、その後開発者がレビューを行うと発表した。

The Decoder·4月23日·★★★★

言語モデルの活用に関する7つの具体的で非伝統的な方法

本記事は、言語モデルを従来の用途以外で活用するための7つの具体的な方法を提案している。読者は、これらのユニークな応用例を通じて、AIの潜在的な可能性を広げ、独自のプロジェクトや業務効率化に役立てることを目指す。

KDnuggets·4月23日·★★★★

GPT-5.5の発表

OpenAIは最新モデル「GPT-5.5」を発表した。同モデルは高速化と高度な能力を備え、コーディングや研究、データ分析などの複雑なタスクに対応する。

OpenAI News·4月23日

OpenAI、医療従事者向け新ChatGPTが臨床業務で医師を凌駕と主張(無制限の時間・ネットアクセス付きでも)

OpenAIは医療従事者向け無料ChatGPTを公開した。ベンチマーク結果により、GPT-5.4は臨床業務で医師を上回ると主張している。

The Decoder·4月23日·★★★★