#software engineering のAIニュース
40件の記事
GitHub Copilot エージェント型ハッチのモデル・タスク間での性能と効率の評価
GitHub は、Copilot SDK に含まれるエージェント型ハッチが複数のモデルやタスク間でどのように機能するかを評価し、この共通コンポーネントの改善が CLI やアプリなど全ての体験に波及効果をもたらすことを示した。
Omio、OpenAI モデルを活用して旅行製品開発を加速
多言語・多モーダルな旅行プラットフォーム「Omio」は、エンジニアリング業務全体に OpenAI のモデルを導入し、47 カ国で 3,000 以上の交通事業者と連携する予約インターフェースの迅速な立ち上げを実現した。同社は単なる技術追加を拒否し、全社内機能で業務実行フレームワークの根本的再設計を推進している。
チャリティ・メイジャーズへの引用:コード生産の経済構造が逆転
Simon Willison は、2025 年にコード生成のコストと時間が劇的に低下し、コードが貴重品から使い捨て可能なものへと変化したと、Charity Majors の指摘を引用して伝えている。
自律型コードレビュー(15 分読了)
Faros AI の 2026 年データによると、コーディングエージェントの普及により開発者の信頼判断が重要となり、コード変更量が 861% 増加し、不具合率も 9% から 54% に上昇した。
Claude Code ガイド 2026:例付き 25 の機能とデモ
MarkTechPost は、メモリやサブエージェントなど多層構造を持つ Claude Code の 25 の機能と戦略を、AI エンジニア向けに解説している。
内側から再構築:AWS プロフェッショナルサービスがフロンティアチームとして歩み始めた理由
AWS プロフェッショナルサービスは、既存プロセスに AI ツールを追加するのではなく、提供方法を根本的に再構築することで、エンゲージメント期間を数ヶ月から数日に短縮した。
Notion で Codex が可能にする機能とは
OpenAI は、自社の AI コード生成モデル「Codex」が Notion の利用体験をどのように拡張し、ユーザーに新たな価値をもたらすかを解説した。
大規模Androidアプリで、技術をどう現場に適用するか。Yahoo! JAPANアプリで挑む「アジリティとサステナビリティ」の両立
Anthropic や OpenAI は、ユーザーが支払う 100 ドルあたり 1,000 ドル以上を費やしている可能性がある(39 分読了)
TLDR AI は、LLM を活用したコーディングがすぐに安価になる見込みはないと指摘し、現在の利用はサブスクリプションの大幅な補助によるものだと説明しています。API を使用した本格的なユースケースではコストが高騰しており、開発者は費用増への備えとしてより堅牢なシステムの構築を準備する必要があるとしています。
Anthropic、新生産コードの80%がClaudeによって作成されたと発表—企業も追いつく方法とは(7分読了)
Anthropicは、自社の生成AIモデル「Claude」が現在、新規に作成される生産用コードの80%を担っていると発表した。同社は、他社を含む企業がどのようにしてこの技術導入を加速し、競争力を高めるべきかについて具体的な戦略を示している。
Claude Code の構築から学んだこと:スキル活用方法について
Anthropic は、Claude Code の開発過程で得た教訓を共有し、同ツールがどのように「スキル」機能を活用しているかを解説した。
大規模なエージェント開発の検証(8 分読了)
Cognition のイド・ペソク氏は、Devin に自律的なエンドツーエンドテストを組み込む過程で得た教訓を共有。Devin セッションの非同期実行が対話型を上回り、マージ前の検証結果が必須要件となったと述べる。
動的ワークフローの紹介(3 分読了)
Jarred Sumner は動的ワークフローを活用し、Bun を Zig から Rust に書き換え、11 日間で 75 万行のコードを処理してテストスイートの成功率 99.8% を達成した。この手法では Claude がタスクを細分化し、エージェントが並列実行して結果が収束するまで動作する。
非同期エージェントの時代 — Cognition のワルデン・ヤン氏と OpenInspect のコール・マレー氏
Cognition のワルデン・ヤン氏と OpenInspect のコール・マレー氏が、エージェント業界における主要な緊張関係や DIY エージェントの容易さについて議論している。
エンドバが Codex を活用してエージェント型組織を構築する方法
企業コンサルティング大手のエンドバは、OpenAI の Codex を導入し、業務プロセスの自動化と意思決定の効率化を実現することで、組織全体を自律的なエージェント型構造へと変革した。
AI コーディングスタートアップ Cognition が 250 億ドルの企業価値で 10 億ドルを調達
AI コーディング分野のスタートアップである Cognition が、事前評価額 250 億ドル(約 3.7 兆円)で 10 億ドル(約 1,480 億円)の資金調達に成功した。この大口投資により同社は業界内での地位をさらに強化する見込みである。
DeepSWE:長期的なソフトウェア工学のための新ベンチマーク
DeepSWE は、91 のリポジトリと 5 つの言語にまたがる長期的なソフトウェア工学タスクを対象とした新しいベンチマークです。この手法は、モデルが事前に解決策を見ていないことを保証し、汚染のない課題、現実世界の複雑さの反映、多様なリポジトリのカバー、信頼性の高い検証プロセスという 4 つの主要な改善点を提供します。
GitHub、Gartner エンタープライズ AI コーディングエージェント マジッククアドラントで 3 年連続リーダーに選出
Gartner が発表したレポートにより、GitHub がエンタープライズ向け AI コーディングエージェント分野で 3 年連続してリーダーの地位を維持したと発表された。同社はコード生成だけでなく、レビューやセキュリティ管理など SDLC の全段階でのエージェント機能の実現を目指す方針を示している。
Miro が Amazon Bedrock を活用し、ソフトウェアバグの経路特定精度を向上させ解決時間を数日から数時間に短縮
AI 支援ワークスペース「Miro」は、Amazon Bedrock を導入してバグ分類の精度を高め、解決までの所要時間を従来の数日から数時間へと劇的に短縮した。
ProgramBench:ソースコードなしでソフトウェアを再現するエージェント評価ベンチマーク
ProgramBench は、ドキュメントと実験のみを用いてソースコードなしでソフトウェア実行ファイルを再構築する課題を提供し、200 のタスクにわたる 248,000 以上の動作テストを通じて、外部支援や逆コンパイルを排除した環境でのソフトウェア設計・実装能力を評価します。
AWS は AI を魔法のように喧伝するが、社内エンジニアは異なる現実を語る
Amazon の StoreGen チームは、AI 活用を進めつつも、すべての成果物を人間が最終確認することと、若手開発者の継続的な採用を原則としており、AI による短縮化には限界があると指摘している。
GitHubの利用状況に関する最新情報
GitHubは、最近の2件のインシデントを受け、サービスの信頼性向上と障害時のフェイルオーバー能力を大幅に改善するため、2025年10月から容量を10倍にする計画を実行中であると発表した。
ShopifyのAIフェーズ移行:2026年の使用爆発、無制限のOpus-4.6トークン予算、Tangle、Tangent、SimGym — Shopify CTOミハイル・パラヒンとの対談
ShopifyのCTO、ミハイル・パラヒンは、同社がAIに全投資している現状を解説した。内部のML実験システム、自動リサーチ、顧客シミュレーション、超低遅延検索などの具体例を挙げ、200億ドル規模の企業がAIをどう活用しているか語った。
OpenAIがInfosysと提携し、AIツールをより多くの企業に提供
InfosysはOpenAIのツールを統合し、顧客企業の開発近代化と業務自動化、AI導入を支援する。当初はソフトエンジニアリングやレガシー刷新、DevOpsに注力する。
【AIニュース】プルリクエストの終焉(2005-2026)
GitHubはオープンソースリポジトリでプルリクエスト機能を無効にするオプションを初めて導入した。これは15年間コード開発の標準だったプルリクエストという概念の変革を示唆し、従来のコードレビュープロセスに新たな変化をもたらす可能性がある。
トークン億万長者のための極限ハルネスエンジニアリング:100万行コード、日量10億トークン、人間コード・レビューゼロ
OpenAIのRyan Lopopolo氏が「ハルネスエンジニアリング」を提唱。100万行のコードと日量10億トークンを処理し、人間によるコーディングやレビューを排除する新アプローチを発表。AIE Europeでの基調講演で注目を集めている。
コーダーの後のコーディング:私たちが知るコンピュータプログラミングの終わり
ニューヨーク・タイムズ誌のクライブ・トンプソン記者が、Google、Amazon、Microsoft、Appleなどの70人以上のソフトウェア開発者に取材し、AI支援開発がプログラミングの本質を変えつつあると報告した。
AIアプリはどこにあるのか?
Vibecodingやエージェントツールの支持者は生産性が大幅に向上すると主張する。しかし、 skepticは「なぜ目に見えるアプリが少ないのか」と疑問を呈し、ソフトウェア作成コストの低下が必ずしもソフトウェア需要の増加や生産量増に直結しないという前提を問うている。
プレゼンテーション:AIネイティブ開発の4つのパターン
Patrick Debois氏が、AI時代のソフトウェアエンジニアリングの進化について議論し、プロデューサーからマネージャーへの移行、仕様駆動開発による実装より意図への焦点、配信から発見への移行、エージェント知識の管理という4つの主要パターンを共有した。
プレゼンテーション: 技術的移行を決断したあなたへ
ソフィー・クーニンが、Monzo社のTypeScript移行を事例に、大規模技術移行の現実と、文書化・ツール・測定可能なマイルストーン設定などの実践手法を解説する。
エージェント型手動テスト
サイモン・ウィリソン氏が、コードを実行して検証できるコーディングエージェントの利点を説明し、LLMが生成したコードは実行確認が必要と指摘している。
10年後、私の仕事はまだ存在しているだろうか
著者が、AIや自動化の進展により、自身の仕事が10年後も存続するか不確実性を感じていることを述べている。
6000万件のCopilotコードレビューを達成
GitHubは、Copilotコードレビュー(CCR)の利用が昨年4月の開始から10倍に増加し、現在GitHub上のコードレビューの5件に1件以上を占めていると発表した。同社はコメント品質向上のための継続的な実験を実施し、リポジトリの文脈を取得するエージェント型アーキテクチャに移行した。
PlanetScale、Bugbotで本番環境の信頼性を保護
PlanetScaleはBugbotを導入し、本番環境の信頼性を保護した。Bugbotは2人のフルタイムエンジニアに相当するレビュー作業を削減した。
オープンソース、SaaS、そして無制限コード生成後の沈黙
AI企業が無制限コード生成を提供した後、開発者からのフィードバックが減少し、オープンソースとSaaSモデルに影響を与えている。
エージェント工学パターンについての執筆
新しいプロジェクトとして、コーディングエージェント開発の最良の結果を得るためのコーディング実践とパターンである「エージェント工学パターン」の収集と文書化を開始しました。
2026年にソフトウェアがどのように構築されるかを定義する8つのトレンド
記事は、2026年までにソフトウェア開発の方法を定義する8つの主要なトレンドを提示している。これには、AI支援コーディング、低コード/ノーコードプラットフォームの普及、クラウドネイティブ開発の進化、セキュリティの左シフト、分散チームのためのコラボレーションツールの向上、持続可能なソフトウェア開発の重視、エッジコンピューティングの統合、および開発者体験の最適化が含まれる。
育てるほど楽になるAI開発体制の構築について
複雑なドメインを持つ新規サービス開発で、AI活用による開発生産性向上の仕組みと具体例を紹介。
Spec-FirstとテストファーストでAI開発の品質を向上させる
Claude Codeを用いてSpec-Firstとテストファーストを実践し、AI生成コードの品質向上に取り組んだ事例を紹介。
Devinとの1ヶ月間の考察
2024年3月、Founders Fundらが支援するAI企業IOIが、全自動ソフトウェアエンジニア「Devin」を公開した。IOIメダリストらによって開発されたDevinは、人間のような対話で自律的にプログラミングタスクを遂行する製品である。