#コード生成 のAIニュース
122件の記事
LLM の過去半年を5分で解説
Simon Willison氏がPyCon US 2026で発表した、大規模言語モデルの過去半年の動向をまとめたスライドを紹介する。
Grok Build の紹介:ターミナルから動作するコーディングエージェント
xAI が開発したコーディングエージェント「Grok Build」が、SuperGrok Heavy 契約者のための早期ベータ版として公開されました。このツールはターミナル上で動作し、サブエージェントやヘッドレスモードをサポートしています。
バイブコーディングとエージェントエンジニアリングの融合への懸念
著者は、AI コーディングツールのポッドキャスト出演を通じて、自身の業務において「バイブコーディング」と「エージェントエンジニアリング」が思わぬほど接近し始めているという驚きと懸念を表明した。
Mistral Medium 3.5 がリモート Vibe エージェントを駆動し、長時間非同期コーディングタスクを可能に
Mistral AI は、128B パラメータの高密度モデル「Mistral Medium 3.5」を発表しました。このモデルは CLI や Le Chat から起動可能なリモート Vibe エージェントを駆動し、クラウド上で複雑な多段階コーディングタスクを実行します。
Laguna XS.2 と M.1:詳細解説(20 分読了)
Poolside が公開したコーディング用エージェントモデル「Laguna M.1」と軽量版「XS.2」について、長期タスク対応能力やオープンソース化の概要を解説する。
ソフトウェア開発の未来:AI 時代における開発量の減少
Andrew Ng が設立した DeepLearning.AI が主催するカンファレンスで、世界中から集まった 3,000 人以上の開発者が、AI 時代のソフトウェアエンジニアリングが今後どうなるかについて議論しました。
GPT-5.5 の能力と反応:期待通りのシステムカードと実用性
Drake Thomas が分析した GPT-5.5 のシステムカードは、OpenAI が提示した新モデルの性能が業界の予想通りであることを示しています。このモデルは汎用的な知能や明確なコーディングタスクにおいて前世代より向上しており、特定の用途では最適な選択肢となり得る競争力を持つと評価されています。
Google、新規コードの75%をAIが生成していると発表
Googleは、社内における新規コードの75%がAIによって生成され、その後開発者がレビューを行うと発表した。
Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化
Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。
ブログからニュースレターへのツールに新しいコンテンツタイプを追加
Simon Willison氏が、自身のブログからSubstackニュースレターへの自動転送ツールに新しいコンテンツタイプを追加し、エージェンティック・エンジニアリング・パターンの例として短いプロンプトで多くの作業を完了させた手法を紹介した。
NVIDIA Dynamoによるエージェント推論のフルスタック最適化
NVIDIAがDynamoを発表し、エージェント推論のフルスタック最適化を提供。Stripeのエージェントは週1300以上のPRを生成、RampはマージPRの30%をエージェントに帰属。
Anthropic、Claude Code向けにエージェントベースのコードレビュー機能を導入
Anthropicは、Claude Code向けに新しいコードレビュー機能を導入し、複数のAIレビュアーを使用してコード変更を分析するエージェントベースのプルリクエストレビューシステムを追加した。
OpenAIが強化版CodexでAnthropicに対抗、デスクトップでの支配力を強化
OpenAIがエージェント型コーディングツールを大幅に刷新し、新機能を追加した。同社は強化版CodexでAnthropicに対抗し、デスクトップ環境での影響力を高めている。
AnthropicのClaude Opus 4.7、コーディングで大きな進歩を達成、一方でサイバーセキュリティ機能を意図的に縮小
Anthropicが新フラッグシップモデルClaude Opus 4.7を発表した。同モデルはコーディングタスクで大幅な改善を実現したが、訓練中に特定のサイバーセキュリティ機能を意図的に低減させた。
DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法
NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。
Claude Opus 4.7が一般提供開始
Anthropic社が最新モデルClaude Opus 4.7をGitHub Copilotで提供開始した。同モデルは多段階タスクの性能向上とエージェント実行の信頼性向上を実現し、長期的推論と複雑なワークフローでも改善を示している。
AIエージェントでコードを保護するスタートアップGitar、900万ドル調達でステルス解除
スタートアップ企業Gitarは、AIエージェントを使用してコードのセキュリティを確保するサービスを提供し、900万ドルの資金調達を発表した。同社はAIで生成されたコードをAIでレビューする手法を採用している。
Copilotクラウドエージェントで3クリックでマージコンフリクトを修正
GitHubがCopilotクラウドエージェントを搭載した「Fix with Copilot」ボタンを導入し、ユーザーが3クリックでマージコンフリクトを自動修正できるようにした。Copilotはコンフリクトを解決し、ビルドとテストを確認してプッシュする。
Import AI 453:AIエージェントの突破、MirrorCode、そして段階的な権限剥奪に関する10の視点
Jack Clarkは2026年ビルダーバーグ会議出席に伴う短縮版newsletterを公開。AIがソフトウェアの逆エンジニアリングを行う可能性や、AIエージェントの進展、そして「段階的な権限剥奪」に関する10の視点を論じている。
GitHub Copilot Proの新規無料トライアルを一時停止
GitHubは、無料トライアルシステムの悪用が急増したため、プラットフォームの健全性を保護するため、新規GitHub Copilot Proトライアルを一時停止し、保護メカニズムの強化を調査している。
Copilotクラウドエージェントの検証ツールが20%高速化
GitHubのCopilotクラウドエージェントが、コード作成時に実行するセキュリティ・品質検証ツール(CodeQLなど)を並列処理化し、検証時間を20%短縮した。これにより、品質を維持しながら高速にコード生成できるようになった。
GLM-5.1がLMArenaコードランキングでオープンソース1位、世界3位を獲得
智谱のGLM-5.1が、AI評価プラットフォームLMArenaのコード性能ランキングでオープンソースモデル1位、全モデル中3位を達成した。同モデルは長期間タスクで8時間でのLinuxデスクトップ構築などの成果を上げ、Claude Opus 4.6に次ぐ持続作業能力を持つ数少ないモデルとなった。
OpenAIにおけるAIの応用
OpenAIは、ChatGPTやCodex、APIなどの製品を通じて、AIを仕事・開発・日常業務に実用的に活用する方法を探求している。
Zhipu AIのGLM-5.1、数百回の反復で自らのコーディング戦略を再考可能
Zhipu AIがMITライセンスでGLM-5.1モデルをリリースした。同モデルはコーディングタスクにおいて、数百回の反復を通じて自らのアプローチを改善できると報告されている。
Amazon Bedrockにおける強化学習ファインチューニング:ベストプラクティス
AWSが、Amazon Bedrockで強化学習ファインチューニング(RFT)のベストプラクティスを公開した。これにより、AIモデルの性能向上とカスタマイズが可能になる。
GitHub Mobile: Copilotクラウドエージェントでどこでも研究とコーディング
GitHubは、CopilotクラウドエージェントがGitHub Mobileでプルリクエスト以外のワークフローをサポートすると発表した。ユーザーはモバイル端末からコードベースの調査、実装計画の生成、ブランチでのコード変更を実行できる。
AnthropicのProject Glasswingはモデル悪用防止に不十分かもしれない
Anthropicは、AIのコード生成能力向上と技術の潜在的な脅威への懸念に対応するProject Glasswingを発表したが、モデル悪用防止には不十分との指摘がある。
プレゼンテーション:AIコーディングアシスタントの現状
Birgitta Böckelerが、AIエージェントが「雰囲気コーディング」を超えて洗練されたコンテキストエンジニアリングへ進化し、自律的なコード生成に必要な安全策を構築する方法について議論している。
Claude Codeにおけるサブエージェントの使用方法と適切なタイミング
Anthropicが開発したClaude Codeにおいて、サブエージェントをどのように、いつ使用するべきかを解説している。
Claude Codeにおけるサブエージェントの使用方法と適切なタイミング
Anthropicが開発したClaude Codeで、サブエージェントをいつ、どのように使用するべきかを説明している。具体的なユースケースと実装方法を提供する。
13言語Claude Codeベンチマークで動的言語が高速かつ低コストと判明
RubyコミッターのYusuke EndohがClaude Codeで13言語をベンチマークし、Ruby・Python・JavaScriptが最速・最安値(1実行0.36-0.39ドル)と報告。静的型言語は1.4-2.6倍高コストで、動的言語に型チェッカー追加は1.6-3.2倍遅延。
AIで8年間の構想を3ヶ月で実現
Lalit Maganti氏が、8年間構想していたSQLite開発ツール「syntaqlite」を、AIを活用してわずか3ヶ月で構築した事例を紹介している。
Copilotクラウドエージェントの組織ランナー制御
GitHubは、Copilotクラウドエージェントのランナー設定をリポジトリレベルから組織レベルに拡張し、チームが大規模ランナーやセルフホストランナーを一貫して適用できるようにした。
本番環境でエージェントが自己修復する仕組み
LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。
Zhipu AIのGLM-5V-Turboがデザインモックアップを直接実行可能なフロントエンドコードに変換
中国AIスタートアップZhipu AIが、画像・動画・テキストを処理するマルチモーダルモデルGLM-5V-Turboをリリースし、デザインモックアップから実行可能なフロントエンドコードを生成する機能を提供した。
Claude Codeのソースコード漏洩、OpenAIが動画生成から撤退、Geminiが音楽生成を追加、LLMが推論時に学習
Claude Codeのソースコードが漏洩し、OpenAIが動画生成事業から撤退した。一方、Geminiは音楽生成機能を追加し、大規模言語モデルが推論時に学習する技術が進展している。
GitHub Copilot SDKがパブリックプレビューで利用可能に
GitHubがCopilot SDKをパブリックプレビューで公開した。開発者はこのSDKを使用して、Copilotのエージェント機能を自社のアプリケーションやワークフローに組み込めるようになる。
Copilot組織カスタム指示が一般提供開始
GitHub Copilotの組織カスタム指示機能が一般提供を開始した。Copilot BusinessおよびEnterpriseの管理者が、組織内の全リポジトリでCopilotの動作をガイドするデフォルト指示を設定できるようになった。
GLM-5V-Turbo発表:マルチモーダルコーディング基盤モデル
智譜がGLM-5V-Turboをリリースした。同モデルはマルチモーダルコーディング基盤モデルである。
Copilotクラウドエージェントによる研究、計画、コーディング
GitHubがCopilotクラウドエージェントをプルリクエスト以外のワークフローにも拡張し、ブランチ上で直接コード生成できる柔軟性を提供した。
Cloudflare、Dynamic Workersのオープンベータを開始:AIエージェントコード実行のためのアイソレートベースのサンドボックス化
CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。
Soohoon Choiの引用
Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。
GitHub CopilotにおけるClaude Sonnet 4の廃止予定
GitHubは2026年5月1日に、GitHub Copilot全機能でClaude Sonnet 4モデルを廃止し、代替としてClaude Sonnet 4.6への移行を推奨している。管理者は設定で代替モデルへのアクセスを有効化する必要がある。
Copilotクラウドエージェントによる研究、計画、コーディング
MicrosoftがCopilotクラウドエージェントをプルリクエスト以外のワークフローでも利用可能に拡張し、ブランチ上で直接コード生成できる柔軟性を提供した。
Qwen3.5-Omniが音声指示と映像からコードを書く方法を誰にも教わらずに習得
アリババが音声・映像・画像・テキストを処理する多モーダルAIモデル「Qwen3.5-Omni」を発表した。同モデルは音声タスクでGemini 3.1 Proを上回り、訓練なしに音声指示と映像入力からコードを生成する能力を獲得した。
Qodo、AIコーディング拡大に伴いコード検証で7000万ドルを調達
Qodoは、AIが生成するコードの信頼性確保を課題とし、コード検証プラットフォーム開発のために7000万ドルの資金調達を実施した。
Googleの新Gemini API Agent SkillがAIモデルのSDK知識ギャップを解消
GoogleがGemini API Agent Skillを発表した。この機能は、トレーニング後に更新された自社SDKの情報をAIモデルに提供し、コーディング結果を大幅に改善する。
SwiftUIアプリをヴァイブコーディングするのはとても楽しい
筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。
Composer 2に関する技術レポート
Composer 2が、依存関係管理ツールとして、パフォーマンス向上や新機能を提供する技術的詳細を公開した。
AIで1日でJSONataを書き直し、年間50万ドルを節約
Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。