#コーディングエージェントのAIニュース

62件の記事

DeepReinforce が Ornith-1.0 を公開：自律的に RL スキャフォールドを学習するオープンソースコーディングモデルファミリー

DeepReinforce は、自律的に強化学習の枠組みを学習できる「Ornith-1.0」というオープンソースのコーディングモデルファミリーを発表した。このモデルは 9B から 397B の 4 サイズで構成され、Gemma 4 や Qwen 3.5 をベースに後方学習されている。

MarkTechPost·6月26日·★★★★

今日は何も大きな出来事はありませんでした

Smol AI News は、6 月 24 日から 25 日にかけての期間に、12 のサブレッドや 544 件の Twitter を調査しましたが、特に注目すべき AI テクノロジー関連のニュースは発生しませんでした。

Smol AI News·6月25日·★★★★

AI SDK ハーネスに「Deep Agents」と「OpenCode」が追加され利用可能に

Vercel は、アプリケーションコードを変更せずにランタイムを切り替えられる AI SDK ハーネスに、「Deep Agents」と「OpenCode」の 2 つの新規アダプターを追加した。これらは Vercel サンドボックス内で動作し、ファイル操作やシェルツールなどの機能を備えている。

Vercel Blog·6月25日·★★★★

xAI、Grok Build に「/goal」モードを追加し、多段階コーディングタスクにおける自律実行と内蔵検証機能を強化

xAI はターミナル型コーディングエージェント「Grok Build」に新機能「/goal」を導入した。この機能により、ユーザーは複雑な実装タスクを指示するだけで、エージェントが検証プロセスを含めて自律的にタスク完了まで継続して実行できるようになる。

MarkTechPost·6月23日·★★★★

非同期コーディングエージェント「Open SWE」の公開を発表

LangChain が、開発者がコードを生成・修正できる非同期型のオープンソースコーディングエージェント「Open SWE」を公開した。

LangChain Blog·6月17日

ゲオルギ・ジェルガノフ氏への言及：Qwen3.6-27B のコーディング能力について

Simon Willison は、Georgi Gerganov 氏が Qwen3.6-27B モデルをローカル環境でコーディングタスクにほぼ毎日使用しており、実用的なツールとして非常に有能力であると証言していることを紹介した。

Simon Willison Blog·6月17日·★★★★

LangChain がコーディングエージェントの予測可能性を高める方法

LangChain は、コーディングエージェントがより予測可能な動作を行うための手法を開発・実装した。これにより、開発プロセスにおけるエージェントの挙動制御が可能となった。

LangChain Blog·6月16日

Cohere がエージェント型コーディングモデルを発表

AI 企業 Cohere が、コード生成やデバッグを自律的に実行できる新しいエージェント型コーディングモデルの公開を開始した。

TLDR AI·6月10日·★★★★

[AINews] FrontierCode：コードの質を評価するベンチマーク「Slop」への対抗

Latent Space が、AI 生成コードの質を測定する新ベンチマーク「FrontierCode」を発表し、低品質な出力（Slop）との戦いを開始した。

Latent Space·6月9日·★★★★

ラップトップを閉じても安全：Amazon Bedrock AgentCore でのコーディングエージェントのホスティング

AWS は、Amazon Bedrock AgentCore を活用することで、開発者がラップトップを閉じた状態でもバックグラウンドで動作するコーディングエージェント（Claude Code や Codex など）を継続して実行可能にする仕組みを発表した。

AWS Machine Learning Blog·6月9日·★★★★

今日は何も大きな出来事はありませんでした

Smol AI News は、6月5日から8日にかけての期間に12件のサブレッドと544件のツイートを調査しましたが、特に注目すべきAI関連のニュースや技術進展は見られませんでした。

Smol AI News·6月8日·★★★★

Uber、コスト管理のためClaude CodeなどのAIツールの利用を制限

Uberは2026年のAI予算を4ヶ月で使い果たしたため、Claude CodeなどのAIツールの利用に上限を設けてコスト削減を図っている。

Simon Willison Blog·6月3日·★★★★

オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある（8 分読）

TLDR AI は、現在のオープンソースモデルは分布外タスクで不足しているが、将来的に追いつくと指摘。最終的にオープンモデル生態系はクローズド企業寡占を超え、市場価値も OpenAI や Anthropic の累積を上回ると予測する。

TLDR AI·6月3日·★★★★

話題のベンチマーク: DeepSWEについて

Algomatic Tech Blog·6月2日

Qwen3.7-Plus：多モーダルエージェント知能（36 分読）

アリババクラウドが、視覚と言語を統合した多モーダルエージェントモデル「Qwen3.7-Plus」を公開し、GUI と CLI をシームレスに連携させる機能を備えた。

TLDR AI·6月2日·★★★★

オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある

Interconnects は、2026 年初頭にコーディングエージェントが台頭し、ユーザーが高品質なクローズドモデルに多額の料金を支払い続けるかどうかが、AI エコシステム間の権力バランスを決定する経済的な要因であると指摘している。

Interconnects·6月1日·★★★★

AI サブスクリプションの解約が解決策かもしれない

Simon Willison は、David Wilson の投稿を引用し、AI ツールで多数のプロジェクトを開始したが意図せず完了してしまった経験から、AI サブスクリプションの解約を検討する必要があると述べている。

Simon Willison Blog·6月1日·★★★★

SQLite に AGENTS.md ファイルが追加される

SQLite プロジェクトが、AI エージェント向けにコードベースの理解を支援する AGENTS.md ファイルを追加した。これは開発者からのプルリクエスト受け入れ方針とは別に、エージェントによる解析を目的としている。

Simon Willison Blog·5月28日·★★★★

今日は何も大きな出来事はありませんでした

Smol AI News は、5月4日から5日にかけてのAIニュースを12件のサブレッドと544件のツイートから収集しましたが、特に注目すべき動きは見られませんでした。

Smol AI News·5月26日·★★★★

アルミン・ロナーカーへの引用：AI が生成した不正確な報告の弊害について

Simon Willison は、Almin Ronacher の指摘を引用し、AI が問題報告を再構成して誤った結論を自信満々に提示する現状が、根本原因の特定を不可能にしている問題を指摘しています。

Simon Willison Blog·5月25日·★★★★

Raindrop Workshop（GitHub リポジトリ）

Claude Code にトレーシング機能やコードベースに対する評価スクリプト作成、不具合修正能力を追加するツール「Raindrop Workshop」が公開された。このツールはライブストリーミングトレースや自己修復型評価ループを提供し、主要なプログラミング言語や SDK と互換性がある。

TLDR AI·5月15日·★★★★

もはやロックインされていない

著者は、ミッチェル・ハシモト氏の Bun が Zig から Rust へ移行した発言を思い出し、中規模テック企業の担当者と対話した。同社はコーディングエージェントを活用してレガシーな iPhone と Android アプリの書き換えを完了したと語った。

Simon Willison Blog·5月15日·★★★★

AI コーディングエージェントは保守コスト削減が必須であるという指摘

James Shore は、AI コーディングエージェントの利用で生産性が向上しても、保守コストが同程度に削減されなければ長期的な損害を被ると警告している。

Simon Willison Blog·5月12日·★★★★

Shopify の社内コーディングエージェント「River」が公開チャネルで学習・活動

Shopify の創業者トビアス・リュッケは、Slack で完全に公開される形で動作する社内コーディングエージェントツール「River」を紹介した。この AI はダイレクトメッセージには応答せず、作業用の公開チャンネルでのみ協働を提案している。

Simon Willison Blog·5月12日·★★★★

Claude Code、Codex、そしてエージェント型コーディング #8

著者は、コード生成エージェントの技術向上により注目が高まっている現状を踏まえ、個別の更新報告よりも週次まとめへ統合すると発表した。

The Zvi·5月9日·★★★★

AlphaEvolve：Gemini を搭載したコーディングエージェントが分野全体での影響を拡大

Google は、Gemini を活用して高度なアルゴリズム設計や数学・コンピュータ科学の未解決問題への新発見支援を行うコーディングエージェント「AlphaEvolve」を発表しました。同エージェントはさらに自然世界の物理法則の説明機能を強化し、科学者や企業の研究開発を加速させることを目指しています。

TLDR AI·5月8日·★★★★

コードベースの脆弱性発見を支援するセキュリティハネス「DeepSec」の公開

開発者がクラウド設定不要でローカル環境や既存の契約を利用し、大規模なコードベースから難検出型の脆弱性を特定できるオープンソースツール「DeepSec」が公開された。

Vercel Blog·5月4日·★★★★

従量課金モデルがプロジェクトの雰囲気を損なう？ローカル AI コーディングエージェントを自作する方法

Anthropic や Microsoft が利用量ベースの価格設定へ移行する中、コスト削減のため開発者がローカル環境で独自の AI コーディングエージェントを構築する選択肢を検討している。

The Register AI/ML·5月2日·★★★★

Claude Codeの品質報告に関する最新アップデート

アンソロピックはClaude Codeの品質低下苦情を調査し、AIモデル自体に問題はなく、ツール環境内の3つの不具合が原因であることを明らかにし、詳細な事後報告を公開した。

Simon Willison Blog·4月24日·★★★★

コーディングエージェントにOWASP ASVSレベルを伝えると、生成コードのセキュリティは変わるのか

的場氏は、コーディングエージェントにOWASP ASVSのレベルを指示する実験を実施し、生成コードのセキュリティが向上する可能性を確認した。

Generative Agents·4月21日

Kimi K2.6がVercel AI Gatewayで提供開始

Moonshot AIのKimi K2.6がVercel AI Gatewayで提供開始された。同モデルは複数言語に対応し簡易プロンプトからフロントエンドを生成する。自律型エージェントの安定実行とAPI解釈性能も向上した。

Vercel Blog·4月20日

Cursor 3がエージェントファーストインターフェースを導入、IDEモデルを超える

Anysphere社がCursor 3をリリースし、ファイル編集から並列コーディングエージェント管理へ主モデルを転換した。新ワークスペースはローカルからクラウドへのエージェント引継ぎ、マルチリポジトリ並列実行、プラグインマーケットプレイスをサポートする。

InfoQ·4月16日

【AINews】AIエンジニアヨーロッパ2026

3日間にわたる「AIエンジニアヨーロッパ2026」が終了した。オンライン講座、ワークショップに続き、100本以上の講演が行われた。公式アーカイブで録画が公開中だ。

Latent Space·4月11日·★★★★

エージェント型インフラストラクチャ

LLMとコーディングエージェントが、アプリケーション自体から導出される次世代インフラへの移行を加速している。Vercelでは3か月で週間デプロイ数が倍増し、現在30%以上がコーディングエージェントによって開始されている。

Vercel Blog·4月10日·★★★★

コーディングエージェントの構成要素

著者がコーディングエージェントとエージェントハーネスの全体設計を解説する。エージェントの仕組みと実践的な構成要素について、読者からの質問を踏まえて参照資料として提供する。

Sebastian Raschka·4月4日

脆弱性研究は終わった

トーマス・プタチェックが、最新のフロンティアモデルが脆弱性研究分野に与える急激で巨大な影響について論じている。今後数ヶ月で、コーディングエージェントがエクスプロイト開発の実践と経済性を劇的に変えると予測している。

Simon Willison Blog·4月4日·★★★★

コーディングエージェントの認知的影響

サイモン・ウィリソン氏がレニー・ラチツキー氏とのポッドキャストで、コーディングエージェントがプログラマーの認知負荷に与える影響について議論した。

Simon Willison Blog·4月4日

Qwen3.6-Plus：コーディングエージェント能力の全面的な向上

通義実験室がQwen3.6-Plusを発表し、AIモデルのコーディングエージェント能力を強化した。100万トークンのコンテキストウィンドウを標準サポートし、フロントエンド生成やコード修正などのタスク実行を改善した。

通义大模型·4月2日·★★★★

コパイロット応用科学におけるエージェント駆動開発

AI研究者が、従来の自動化を超えて知的作業を自動化し、自身の役割を根本的に変化させた事例を報告している。

GitHub Blog·4月1日·★★★★

ゲオルギ・ゲルガノフ氏の発言を引用

ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。

Simon Willison Blog·3月31日

スピードを落とすことについての考察

Mario Zechner氏が、現在のエージェント工学のトレンドについて、過度なスピード追求と規律の欠如を批判している。

Simon Willison Blog·3月26日

QCon London AIコーディングの現状：より高性能で高コスト、より危険なコーディングエージェント

ThoughtworksのAIコーディング責任者Birgitta Böckelerが、AIコーディング分野では自律型コーディングエージェントの使用が進む一方で、セキュリティリスクの増大とコスト上昇が主要な懸念事項だと指摘した。

InfoQ·3月22日

コーディングエージェントでのGitの活用

開発者Simon Willison氏が、Gitをコーディングエージェントと連携させる重要性を説明している。Gitによるバージョン管理はコード変更の記録や誤りの調査・修正を可能にし、エージェントは基本的・高度なGit機能を活用できる。

Simon Willison Blog·3月22日

内部コーディングエージェントの不整合を監視する方法

OpenAIは、内部コーディングエージェントの不整合を調査するために連鎖思考監視を活用し、実世界での展開を分析してリスクを検出し、AI安全対策を強化している。

OpenAI News·3月19日·★★★★

Codexでのサブエージェントとカスタムエージェントの使用

OpenAIがCodexでサブエージェントの一般提供を開始した。エクスプローラー、ワーカー、デフォルトのデフォルトサブエージェントを提供し、Claude Codeの実装と類似している。

Simon Willison Blog·3月17日

データ分析のためのコーディングエージェント

Simon Willison氏が、データジャーナリスト向けに、Claude CodeやOpenAI Codexなどのツールを使用してデータを探索・分析・整理する方法を紹介するワークショップ資料を公開した。

Simon Willison Blog·3月17日

エージェンティック・エンジニアリングとは何か

著者のSimon Willison氏が、コーディングエージェント（Claude Code、OpenAI Codexなど）の支援を受けてソフトウェアを開発する実践を「エージェンティック・エンジニアリング」と定義している。

Simon Willison Blog·3月16日

コーディングエージェントがエンジニアリング、製品、デザインを再構築する方法

LangChain社が、コーディングエージェントがソフトウェア開発におけるエンジニアリング、製品、デザインの役割を変革し、コード作成を容易にしていると指摘した。

LangChain Blog·3月11日·★★★★

AIはより優れたコード生成を支援すべき

開発者のサイモン・ウィリソン氏は、AIツールによるコード生成が品質低下を招く懸念に対し、エージェント型エンジニアリングパターンを活用して問題を直接解決し、AIがより良いコード生成を支援するべきと主張している。

Simon Willison Blog·3月11日

つまらない技術ではないかもしれない

著者が、LLMがプログラミングに与える影響について、訓練データに多く含まれるツールが優先され、新たな優れたツールの普及を妨げる可能性を指摘している。過去にはPythonやJavaScriptの質問が他言語より良い結果を出したが、最近のモデルでは改善が見られる。

Simon Willison Blog·3月9日

1 / 2次へ →

#コーディングエージェント のAIニュース

DeepReinforce が Ornith-1.0 を公開：自律的に RL スキャフォールドを学習するオープンソースコーディングモデルファミリー

今日は何も大きな出来事はありませんでした

AI SDK ハーネスに「Deep Agents」と「OpenCode」が追加され利用可能に

xAI、Grok Build に「/goal」モードを追加し、多段階コーディングタスクにおける自律実行と内蔵検証機能を強化

非同期コーディングエージェント「Open SWE」の公開を発表

ゲオルギ・ジェルガノフ氏への言及：Qwen3.6-27B のコーディング能力について

LangChain がコーディングエージェントの予測可能性を高める方法

Cohere がエージェント型コーディングモデルを発表

[AINews] FrontierCode：コードの質を評価するベンチマーク「Slop」への対抗

ラップトップを閉じても安全：Amazon Bedrock AgentCore でのコーディングエージェントのホスティング

今日は何も大きな出来事はありませんでした

Uber、コスト管理のためClaude CodeなどのAIツールの利用を制限

オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある（8 分読）

話題のベンチマーク: DeepSWEについて

Qwen3.7-Plus：多モーダルエージェント知能（36 分読）

オープンモデルとクローズドモデルは異なる指数関数的成長曲線にある

AI サブスクリプションの解約が解決策かもしれない

SQLite に AGENTS.md ファイルが追加される

今日は何も大きな出来事はありませんでした

アルミン・ロナーカーへの引用：AI が生成した不正確な報告の弊害について

Raindrop Workshop（GitHub リポジトリ）

もはやロックインされていない

AI コーディングエージェントは保守コスト削減が必須であるという指摘

Shopify の社内コーディングエージェント「River」が公開チャネルで学習・活動

Claude Code、Codex、そしてエージェント型コーディング #8

AlphaEvolve：Gemini を搭載したコーディングエージェントが分野全体での影響を拡大

コードベースの脆弱性発見を支援するセキュリティハネス「DeepSec」の公開

従量課金モデルがプロジェクトの雰囲気を損なう？ローカル AI コーディングエージェントを自作する方法

Claude Codeの品質報告に関する最新アップデート

コーディングエージェントにOWASP ASVSレベルを伝えると、生成コードのセキュリティは変わるのか

Kimi K2.6がVercel AI Gatewayで提供開始

Cursor 3がエージェントファーストインターフェースを導入、IDEモデルを超える

【AINews】AIエンジニアヨーロッパ2026

エージェント型インフラストラクチャ

コーディングエージェントの構成要素

脆弱性研究は終わった

コーディングエージェントの認知的影響

Qwen3.6-Plus：コーディングエージェント能力の全面的な向上

コパイロット応用科学におけるエージェント駆動開発

ゲオルギ・ゲルガノフ氏の発言を引用

スピードを落とすことについての考察

QCon London AIコーディングの現状：より高性能で高コスト、より危険なコーディングエージェント

コーディングエージェントでのGitの活用

内部コーディングエージェントの不整合を監視する方法

Codexでのサブエージェントとカスタムエージェントの使用

データ分析のためのコーディングエージェント

エージェンティック・エンジニアリングとは何か

コーディングエージェントがエンジニアリング、製品、デザインを再構築する方法

AIはより優れたコード生成を支援すべき

つまらない技術ではないかもしれない

#コーディングエージェントのAIニュース