#aiコーディングエージェント のAIニュース
23件の記事
Cursor-Opus エージェントがスタートアップの生産用データベースを消去
自動車SaaS「PocketOS」創業者のジェレミー・クレイン氏は、同社のAIコーディングエージェントが10秒以内に生産用データベースを消去する事故を経験した。データは回復済みで、開発は継続されている。
「トークンマキシング」が開発者の生産性を予想以上に低下させている
開発者が「トークンマキシング」手法を用いると、コード量が増加し、コストが上昇し、書き直しが多くなるため、実際の生産性が低下するという問題を指摘している。
AI時代におけるQA戦略の変革
タップル社は、Claude CodeやDevinなどのAIコード生成ツールの普及により、QA(品質保証)プロセスが根本的に変革されるべきだと提言している。
EmDashの紹介 ― WordPressの精神的後継者でありプラグインのセキュリティ問題を解決
開発チームがAIコーディングエージェントを使用してWordPressを一から再構築し、プラグインのセキュリティ問題を解決する新プラットフォーム「EmDash」を開発した。
責任を持ってエージェントを活用する
Vercel社が、コーディングエージェントが生成するコードを無批判にデプロイすると悪い前提を本番環境に直接送り込む危険があると指摘し、厳格な判断と責任あるフレームワークの必要性を公開した。
Claude Code向け自動モード
Anthropic社がClaude Codeに自動モードを導入した。このモードでは、Claudeがユーザーの代わりに権限決定を行い、実行前に安全対策が動作を監視する。
AIの指数関数的成長におけるプロダクトマネジメント
AI技術の急速な進化の中で、プロダクトマネージャーが従来の手法を適応させ、AI駆動製品の開発・管理に取り組む必要性について論じている。
QCon London 2026: Spotifyのコードベース全体を常に書き換える
SpotifyのJo Kelly-FentonとAleksandar Miticが、AI駆動のコーディングエージェント「Honk」を発表した。同システムはコード移行を改善し、従来のスクリプトでは対応できなかった複雑な問題を解決する。
マネーフォワード、Cursorのコーディングエージェントをプロダクト・デザイン・QA部門に導入
マネーフォワードがCursor社のAIコーディングエージェントをプロダクト開発・デザイン・品質保証部門に導入し、1,000人以上の従業員が日常的に利用している。
Open SWE:社内コーディングエージェントのためのオープンソースフレームワーク
LangChain社が、StripeやRampなど複数企業が独自開発した社内コーディングエージェントを統合するオープンソースフレームワーク「Open SWE」を発表した。既存のSlackやGitHubなどのワークフローに統合可能な設計となっている。
プラグマティック・サミットにおけるエージェンティック・エンジニアリングに関する炉辺談話
筆者がサンフランシスコで開催されたプラグマティック・サミットで、StatsigのEric Luiがホストするエージェンティック・エンジニアリングに関する炉辺談話にスピーカーとして参加した。
Shopify/liquid: パフォーマンス: 解析+レンダリングが53%高速化、メモリ割り当てが61%削減
ShopifyのCEO Tobias Lütkeが、ShopifyのオープンソースRubyテンプレートエンジン「Liquid」に対して、解析とレンダリングの速度を53%向上させ、メモリ割り当てを61%削減するパフォーマンス最適化を提案した。
GPT-5.4が波紋を広げる、AIのモバイル成長、データセンターのオフグリッド化、Appleの拡散研究
OpenAIがGPT-5.4を発表し、AIコーディングエージェント向けの知識共有プラットフォーム構想を提唱した。
新研究がAIコーディングにおけるAGENTS.mdファイルの価値を再評価
ETH Zurichの研究者が、AGENTS.mdファイルはAIコーディングエージェントの妨げになることが多いと結論付け、LLM生成のコンテキストファイルを完全に省略し、人間が書く指示は推測不可能な詳細に限定することを推奨した。
AIエージェントコーディングに懐疑的な人物が詳細に試してみた
Max Woolf氏が、YouTubeメタデータスクレイパーから始めて段階的に複雑化するAIコーディングエージェントのプロジェクトを詳細に検証した。
パシフィック・ノースウェスト国立研究所とOpenAIが連携し、連邦政府の許可手続きを加速
OpenAIとパシフィック・ノースウェスト国立研究所は、AIコーディングエージェントが連邦政府の許可手続きを加速できるかを評価する新ベンチマーク「DraftNEPABench」を発表した。これにより、NEPA草案作成時間を最大15%短縮し、インフラ審査の近代化が可能となる。
tldrawの課題: テストをクローズドソースリポジトリに移行
オープンソースライブラリのテストスイートが完全な再実装を可能にするため、tldrawはテストをクローズドソースリポジトリに移行することを検討しています。
最初にテストを実行せよ
コーディングエージェントを使用する際、自動テストは必須であり、従来の「時間とコストがかかる」という言い訳は通用しない。
コードを書くことは今や安価になった
エージェント工学の実践における最大の課題は、コード作成が低コスト化した結果に適応することである。
赤/緑TDD
コーディングエージェントの結果を改善する簡潔な方法として、「赤/緑TDD」を使用することが提案されている。
ローカルエージェント向けの安全なサンドボックスの実装
macOS、Linux、Windowsでエージェントサンドボックスを構築し、セキュリティを向上させながら中断を減らす方法について。
Amazon Nova AIチャレンジが復活、競合チームにNova Forgeアクセスを提供
学生が最先端AIモデルをカスタマイズして信頼性の高いソフトウェアエージェントを構築できる初の学術コンペ。
2026年2月1日 サイエンス誌:科学研究のための長期実行Claude
Anthropic社がClaude AIを科学研究向けに長期実行可能なバージョンを発表した。研究者が複雑な計算やシミュレーションを継続的に実行できるように設計されている。