#aiコーディングエージェント のAIニュース

23件の記事

Cursor-Opus エージェントがスタートアップの生産用データベースを消去

自動車SaaS「PocketOS」創業者のジェレミー・クレイン氏は、同社のAIコーディングエージェントが10秒以内に生産用データベースを消去する事故を経験した。データは回復済みで、開発は継続されている。

The Register AI/ML·4月28日

「トークンマキシング」が開発者の生産性を予想以上に低下させている

開発者が「トークンマキシング」手法を用いると、コード量が増加し、コストが上昇し、書き直しが多くなるため、実際の生産性が低下するという問題を指摘している。

TechCrunch AI·4月18日·★★★★

AI時代におけるQA戦略の変革

タップル社は、Claude CodeやDevinなどのAIコード生成ツールの普及により、QA(品質保証)プロセスが根本的に変革されるべきだと提言している。

CyberAgent Developers Blog·4月6日·★★★★

EmDashの紹介 ― WordPressの精神的後継者でありプラグインのセキュリティ問題を解決

開発チームがAIコーディングエージェントを使用してWordPressを一から再構築し、プラグインのセキュリティ問題を解決する新プラットフォーム「EmDash」を開発した。

Cloudflare Blog·4月1日·★★★★

責任を持ってエージェントを活用する

Vercel社が、コーディングエージェントが生成するコードを無批判にデプロイすると悪い前提を本番環境に直接送り込む危険があると指摘し、厳格な判断と責任あるフレームワークの必要性を公開した。

Vercel Blog·3月31日·★★★★

Claude Code向け自動モード

Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。

Simon Willison Blog·3月25日·★★★★

AIの指数関数的成長におけるプロダクトマネジメント

AI技術の急速な進化の中で、プロダクトマネージャーが従来の手法を適応させ、AI駆動製品の開発・管理に取り組む必要性について論じている。

Claude Blog·3月19日·★★★★

QCon London 2026: Spotifyのコードベース全体を常に書き換える

SpotifyのJo Kelly-FentonとAleksandar Miticが、AI駆動のコーディングエージェント「Honk」を発表した。同システムはコード移行を改善し、従来のスクリプトでは対応できなかった複雑な問題を解決する。

InfoQ·3月19日·★★★★

マネーフォワード、Cursorのコーディングエージェントをプロダクト・デザイン・QA部門に導入

マネーフォワードがCursor社のAIコーディングエージェントをプロダクト開発・デザイン・品質保証部門に導入し、1,000人以上の従業員が日常的に利用している。

Cursor Blog·3月18日·★★★★

Open SWE:社内コーディングエージェントのためのオープンソースフレームワーク

LangChain社が、StripeやRampなど複数企業が独自開発した社内コーディングエージェントを統合するオープンソースフレームワーク「Open SWE」を発表した。既存のSlackやGitHubなどのワークフローに統合可能な設計となっている。

LangChain Blog·3月18日·★★★★

プラグマティック・サミットにおけるエージェンティック・エンジニアリングに関する炉辺談話

筆者がサンフランシスコで開催されたプラグマティック・サミットで、StatsigのEric Luiがホストするエージェンティック・エンジニアリングに関する炉辺談話にスピーカーとして参加した。

Simon Willison Blog·3月15日·★★★★

Shopify/liquid: パフォーマンス: 解析+レンダリングが53%高速化、メモリ割り当てが61%削減

ShopifyのCEO Tobias Lütkeが、ShopifyのオープンソースRubyテンプレートエンジン「Liquid」に対して、解析とレンダリングの速度を53%向上させ、メモリ割り当てを61%削減するパフォーマンス最適化を提案した。

Simon Willison Blog·3月13日·★★★★

GPT-5.4が波紋を広げる、AIのモバイル成長、データセンターのオフグリッド化、Appleの拡散研究

OpenAIがGPT-5.4を発表し、AIコーディングエージェント向けの知識共有プラットフォーム構想を提唱した。

The Batch·3月13日·★★★★

新研究がAIコーディングにおけるAGENTS.mdファイルの価値を再評価

ETH Zurichの研究者が、AGENTS.mdファイルはAIコーディングエージェントの妨げになることが多いと結論付け、LLM生成のコンテキストファイルを完全に省略し、人間が書く指示は推測不可能な詳細に限定することを推奨した。

InfoQ·3月7日

AIエージェントコーディングに懐疑的な人物が詳細に試してみた

Max Woolf氏が、YouTubeメタデータスクレイパーから始めて段階的に複雑化するAIコーディングエージェントのプロジェクトを詳細に検証した。

Simon Willison Blog·2月28日·★★★★

パシフィック・ノースウェスト国立研究所とOpenAIが連携し、連邦政府の許可手続きを加速

OpenAIとパシフィック・ノースウェスト国立研究所は、AIコーディングエージェントが連邦政府の許可手続きを加速できるかを評価する新ベンチマーク「DraftNEPABench」を発表した。これにより、NEPA草案作成時間を最大15%短縮し、インフラ審査の近代化が可能となる。

OpenAI News·2月26日

tldrawの課題: テストをクローズドソースリポジトリに移行

オープンソースライブラリのテストスイートが完全な再実装を可能にするため、tldrawはテストをクローズドソースリポジトリに移行することを検討しています。

Andrej Karpathy 厳選·2月26日

最初にテストを実行せよ

コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。

Andrej Karpathy 厳選·2月24日

コードを書くことは今や安価になった

エージェント工学の実践における最大の課題は、コード作成が低コスト化した結果に適応することである。

Andrej Karpathy 厳選·2月24日·★★★★

赤/緑TDD

コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。

Andrej Karpathy 厳選·2月23日

ローカルエージェント向けの安全なサンドボックスの実装

macOS、Linux、Windowsでエージェントサンドボックスを構築し、セキュリティを向上させながら中断を減らす方法について。

Cursor Blog·2月18日·★★★★

Amazon Nova AIチャレンジが復活、競合チームにNova Forgeアクセスを提供

学生が最先端AIモデルをカスタマイズして信頼性の高いソフトウェアエージェントを構築できる初の学術コンペ。

Amazon Science·2月3日·★★★★

2026年2月1日 サイエンス誌:科学研究のための長期実行Claude

Anthropic社がClaude AIを科学研究向けに長期実行可能なバージョンを発表した。研究者が複雑な計算やシミュレーションを継続的に実行できるように設計されている。

Anthropic Research·2月1日·★★★★