#コード生成 のAIニュース

122件の記事

LLM の過去半年を5分で解説

Simon Willison氏がPyCon US 2026で発表した、大規模言語モデルの過去半年の動向をまとめたスライドを紹介する。

Simon Willison Blog·5月19日·★★★★

Grok Build の紹介:ターミナルから動作するコーディングエージェント

xAI が開発したコーディングエージェント「Grok Build」が、SuperGrok Heavy 契約者のための早期ベータ版として公開されました。このツールはターミナル上で動作し、サブエージェントやヘッドレスモードをサポートしています。

TLDR AI·5月15日·★★★★

バイブコーディングとエージェントエンジニアリングの融合への懸念

著者は、AI コーディングツールのポッドキャスト出演を通じて、自身の業務において「バイブコーディング」と「エージェントエンジニアリング」が思わぬほど接近し始めているという驚きと懸念を表明した。

Simon Willison Blog·5月6日·★★★★

Mistral Medium 3.5 がリモート Vibe エージェントを駆動し、長時間非同期コーディングタスクを可能に

Mistral AI は、128B パラメータの高密度モデル「Mistral Medium 3.5」を発表しました。このモデルは CLI や Le Chat から起動可能なリモート Vibe エージェントを駆動し、クラウド上で複雑な多段階コーディングタスクを実行します。

TLDR AI·4月30日·★★★★

Laguna XS.2 と M.1:詳細解説(20 分読了)

Poolside が公開したコーディング用エージェントモデル「Laguna M.1」と軽量版「XS.2」について、長期タスク対応能力やオープンソース化の概要を解説する。

TLDR AI·4月29日·★★★★

ソフトウェア開発の未来:AI 時代における開発量の減少

Andrew Ng が設立した DeepLearning.AI が主催するカンファレンスで、世界中から集まった 3,000 人以上の開発者が、AI 時代のソフトウェアエンジニアリングが今後どうなるかについて議論しました。

The Register AI/ML·4月29日·★★★★

GPT-5.5 の能力と反応:期待通りのシステムカードと実用性

Drake Thomas が分析した GPT-5.5 のシステムカードは、OpenAI が提示した新モデルの性能が業界の予想通りであることを示しています。このモデルは汎用的な知能や明確なコーディングタスクにおいて前世代より向上しており、特定の用途では最適な選択肢となり得る競争力を持つと評価されています。

The Zvi·4月28日·★★★★

Google、新規コードの75%をAIが生成していると発表

Googleは、社内における新規コードの75%がAIによって生成され、その後開発者がレビューを行うと発表した。

The Decoder·4月23日·★★★★

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。

月之暗面 Kimi·4月21日·★★★★

ブログからニュースレターへのツールに新しいコンテンツタイプを追加

Simon Willison氏が、自身のブログからSubstackニュースレターへの自動転送ツールに新しいコンテンツタイプを追加し、エージェンティック・エンジニアリング・パターンの例として短いプロンプトで多くの作業を完了させた手法を紹介した。

Simon Willison Blog·4月18日

NVIDIA Dynamoによるエージェント推論のフルスタック最適化

NVIDIAがDynamoを発表し、エージェント推論のフルスタック最適化を提供。Stripeのエージェントは週1300以上のPRを生成、RampはマージPRの30%をエージェントに帰属。

NVIDIA Developer Blog·4月18日·★★★★

Anthropic、Claude Code向けにエージェントベースのコードレビュー機能を導入

Anthropicは、Claude Code向けに新しいコードレビュー機能を導入し、複数のAIレビュアーを使用してコード変更を分析するエージェントベースのプルリクエストレビューシステムを追加した。

InfoQ·4月17日

OpenAIが強化版CodexでAnthropicに対抗、デスクトップでの支配力を強化

OpenAIがエージェント型コーディングツールを大幅に刷新し、新機能を追加した。同社は強化版CodexでAnthropicに対抗し、デスクトップ環境での影響力を高めている。

TechCrunch AI·4月17日

AnthropicのClaude Opus 4.7、コーディングで大きな進歩を達成、一方でサイバーセキュリティ機能を意図的に縮小

Anthropicが新フラッグシップモデルClaude Opus 4.7を発表した。同モデルはコーディングタスクで大幅な改善を実現したが、訓練中に特定のサイバーセキュリティ機能を意図的に低減させた。

The Decoder·4月17日

DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法

NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。

NVIDIA Developer Blog·4月17日·★★★★

Claude Opus 4.7が一般提供開始

Anthropic社が最新モデルClaude Opus 4.7をGitHub Copilotで提供開始した。同モデルは多段階タスクの性能向上とエージェント実行の信頼性向上を実現し、長期的推論と複雑なワークフローでも改善を示している。

GitHub Changelog·4月16日·★★★★

AIエージェントでコードを保護するスタートアップGitar、900万ドル調達でステルス解除

スタートアップ企業Gitarは、AIエージェントを使用してコードのセキュリティを確保するサービスを提供し、900万ドルの資金調達を発表した。同社はAIで生成されたコードをAIでレビューする手法を採用している。

TechCrunch AI·4月15日

Copilotクラウドエージェントで3クリックでマージコンフリクトを修正

GitHubがCopilotクラウドエージェントを搭載した「Fix with Copilot」ボタンを導入し、ユーザーが3クリックでマージコンフリクトを自動修正できるようにした。Copilotはコンフリクトを解決し、ビルドとテストを確認してプッシュする。

GitHub Changelog·4月14日·★★★★

Import AI 453:AIエージェントの突破、MirrorCode、そして段階的な権限剥奪に関する10の視点

Jack Clarkは2026年ビルダーバーグ会議出席に伴う短縮版newsletterを公開。AIがソフトウェアの逆エンジニアリングを行う可能性や、AIエージェントの進展、そして「段階的な権限剥奪」に関する10の視点を論じている。

Import AI·4月13日·★★★★

GitHub Copilot Proの新規無料トライアルを一時停止

GitHubは、無料トライアルシステムの悪用が急増したため、プラットフォームの健全性を保護するため、新規GitHub Copilot Proトライアルを一時停止し、保護メカニズムの強化を調査している。

GitHub Changelog·4月11日

Copilotクラウドエージェントの検証ツールが20%高速化

GitHubのCopilotクラウドエージェントが、コード作成時に実行するセキュリティ・品質検証ツール(CodeQLなど)を並列処理化し、検証時間を20%短縮した。これにより、品質を維持しながら高速にコード生成できるようになった。

GitHub Changelog·4月10日

GLM-5.1がLMArenaコードランキングでオープンソース1位、世界3位を獲得

智谱のGLM-5.1が、AI評価プラットフォームLMArenaのコード性能ランキングでオープンソースモデル1位、全モデル中3位を達成した。同モデルは長期間タスクで8時間でのLinuxデスクトップ構築などの成果を上げ、Claude Opus 4.6に次ぐ持続作業能力を持つ数少ないモデルとなった。

智谱·4月10日·★★★★

OpenAIにおけるAIの応用

OpenAIは、ChatGPTやCodex、APIなどの製品を通じて、AIを仕事・開発・日常業務に実用的に活用する方法を探求している。

OpenAI News·4月10日

Zhipu AIのGLM-5.1、数百回の反復で自らのコーディング戦略を再考可能

Zhipu AIがMITライセンスでGLM-5.1モデルをリリースした。同モデルはコーディングタスクにおいて、数百回の反復を通じて自らのアプローチを改善できると報告されている。

The Decoder·4月9日

Amazon Bedrockにおける強化学習ファインチューニング:ベストプラクティス

AWSが、Amazon Bedrockで強化学習ファインチューニング(RFT)のベストプラクティスを公開した。これにより、AIモデルの性能向上とカスタマイズが可能になる。

AWS Machine Learning Blog·4月9日·★★★★

GitHub Mobile: Copilotクラウドエージェントでどこでも研究とコーディング

GitHubは、CopilotクラウドエージェントがGitHub Mobileでプルリクエスト以外のワークフローをサポートすると発表した。ユーザーはモバイル端末からコードベースの調査、実装計画の生成、ブランチでのコード変更を実行できる。

GitHub Changelog·4月9日

AnthropicのProject Glasswingはモデル悪用防止に不十分かもしれない

Anthropicは、AIのコード生成能力向上と技術の潜在的な脅威への懸念に対応するProject Glasswingを発表したが、モデル悪用防止には不十分との指摘がある。

AI Business·4月9日

プレゼンテーション:AIコーディングアシスタントの現状

Birgitta Böckelerが、AIエージェントが「雰囲気コーディング」を超えて洗練されたコンテキストエンジニアリングへ進化し、自律的なコード生成に必要な安全策を構築する方法について議論している。

InfoQ·4月8日

Claude Codeにおけるサブエージェントの使用方法と適切なタイミング

Anthropicが開発したClaude Codeにおいて、サブエージェントをどのように、いつ使用するべきかを解説している。

Claude Blog·4月7日

Claude Codeにおけるサブエージェントの使用方法と適切なタイミング

Anthropicが開発したClaude Codeで、サブエージェントをいつ、どのように使用するべきかを説明している。具体的なユースケースと実装方法を提供する。

Claude Blog·4月7日

13言語Claude Codeベンチマークで動的言語が高速かつ低コストと判明

RubyコミッターのYusuke EndohがClaude Codeで13言語をベンチマークし、Ruby・Python・JavaScriptが最速・最安値(1実行0.36-0.39ドル)と報告。静的型言語は1.4-2.6倍高コストで、動的言語に型チェッカー追加は1.6-3.2倍遅延。

InfoQ·4月6日

AIで8年間の構想を3ヶ月で実現

Lalit Maganti氏が、8年間構想していたSQLite開発ツール「syntaqlite」を、AIを活用してわずか3ヶ月で構築した事例を紹介している。

Simon Willison Blog·4月6日

Copilotクラウドエージェントの組織ランナー制御

GitHubは、Copilotクラウドエージェントのランナー設定をリポジトリレベルから組織レベルに拡張し、チームが大規模ランナーやセルフホストランナーを一貫して適用できるようにした。

GitHub Changelog·4月4日

本番環境でエージェントが自己修復する仕組み

LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。

LangChain Blog·4月4日·★★★★

Zhipu AIのGLM-5V-Turboがデザインモックアップを直接実行可能なフロントエンドコードに変換

中国AIスタートアップZhipu AIが、画像・動画・テキストを処理するマルチモーダルモデルGLM-5V-Turboをリリースし、デザインモックアップから実行可能なフロントエンドコードを生成する機能を提供した。

The Decoder·4月3日·★★★★

Claude Codeのソースコード漏洩、OpenAIが動画生成から撤退、Geminiが音楽生成を追加、LLMが推論時に学習

Claude Codeのソースコードが漏洩し、OpenAIが動画生成事業から撤退した。一方、Geminiは音楽生成機能を追加し、大規模言語モデルが推論時に学習する技術が進展している。

The Batch·4月3日

GitHub Copilot SDKがパブリックプレビューで利用可能に

GitHubがCopilot SDKをパブリックプレビューで公開した。開発者はこのSDKを使用して、Copilotのエージェント機能を自社のアプリケーションやワークフローに組み込めるようになる。

GitHub Changelog·4月3日·★★★★

Copilot組織カスタム指示が一般提供開始

GitHub Copilotの組織カスタム指示機能が一般提供を開始した。Copilot BusinessおよびEnterpriseの管理者が、組織内の全リポジトリでCopilotの動作をガイドするデフォルト指示を設定できるようになった。

GitHub Changelog·4月2日

GLM-5V-Turbo発表:マルチモーダルコーディング基盤モデル

智譜がGLM-5V-Turboをリリースした。同モデルはマルチモーダルコーディング基盤モデルである。

智谱·4月2日·★★★★

Copilotクラウドエージェントによる研究、計画、コーディング

GitHubがCopilotクラウドエージェントをプルリクエスト以外のワークフローにも拡張し、ブランチ上で直接コード生成できる柔軟性を提供した。

GitHub Changelog·4月2日

Cloudflare、Dynamic Workersのオープンベータを開始:AIエージェントコード実行のためのアイソレートベースのサンドボックス化

CloudflareがDynamic Worker Loaderのオープンベータを開始し、AI生成コード実行のためのV8アイソレートベースのサンドボックス化を提供。コンテナより約100倍高速で最大100倍のメモリ効率を実現。

InfoQ·4月1日·★★★★

Soohoon Choiの引用

Soohoon Choiは、経済的インセンティブによりAIモデルが優れたコードを書くようになると主張する。優れたコードは生成・維持コストが低く、AIモデル間の競争が激しい中、信頼性の高い機能を迅速に提供できるシンプルで保守性の高いコードを生成するモデルが勝者となるため、市場の力学が優れたコードの普及を促すと述べている。

Simon Willison Blog·4月1日

GitHub CopilotにおけるClaude Sonnet 4の廃止予定

GitHubは2026年5月1日に、GitHub Copilot全機能でClaude Sonnet 4モデルを廃止し、代替としてClaude Sonnet 4.6への移行を推奨している。管理者は設定で代替モデルへのアクセスを有効化する必要がある。

GitHub Changelog·4月1日

Copilotクラウドエージェントによる研究、計画、コーディング

MicrosoftがCopilotクラウドエージェントをプルリクエスト以外のワークフローでも利用可能に拡張し、ブランチ上で直接コード生成できる柔軟性を提供した。

GitHub Changelog·4月1日

Qwen3.5-Omniが音声指示と映像からコードを書く方法を誰にも教わらずに習得

アリババが音声・映像・画像・テキストを処理する多モーダルAIモデル「Qwen3.5-Omni」を発表した。同モデルは音声タスクでGemini 3.1 Proを上回り、訓練なしに音声指示と映像入力からコードを生成する能力を獲得した。

The Decoder·3月31日·★★★★

Qodo、AIコーディング拡大に伴いコード検証で7000万ドルを調達

Qodoは、AIが生成するコードの信頼性確保を課題とし、コード検証プラットフォーム開発のために7000万ドルの資金調達を実施した。

TechCrunch AI·3月30日·★★★★

Googleの新Gemini API Agent SkillがAIモデルのSDK知識ギャップを解消

GoogleがGemini API Agent Skillを発表した。この機能は、トレーニング後に更新された自社SDKの情報をAIモデルに提供し、コーディング結果を大幅に改善する。

The Decoder·3月29日·★★★★

SwiftUIアプリをヴァイブコーディングするのはとても楽しい

筆者が新しいM5 MacBook ProでローカルLLMを実行し、Activity Monitorに不満を持ち、パフォーマンス監視ツールをヴァイブコーディングで開発した。

Simon Willison Blog·3月28日

Composer 2に関する技術レポート

Composer 2が、依存関係管理ツールとして、パフォーマンス向上や新機能を提供する技術的詳細を公開した。

Cursor Blog·3月27日·★★★★

AIで1日でJSONataを書き直し、年間50万ドルを節約

Reco.ai社がAIを活用してJSONataのJSON式言語を1日でGo言語で再実装し、年間50万ドルのコスト削減に成功した。

Simon Willison Blog·3月27日