#autonomous coding のAIニュース
5件の記事
AIEWF 日次レポート:大規模ループ論争と AI エンジニアリングの現状
AI エンジニアリングの世界博覧会最終日に開催された「ループ」を巡る議論は、自律型ソフトウェアファクトリーの実現可能性と、現在のエンジニアリング分野がその進展に追いつけているかという根本的な問いを浮き彫りにした。
Latent Space·7月3日·★★★★
Anthropic Claude Sonnet 5 と Sonnet 4.6、Opus 4.8 の比較:エージェント型コーディングベンチマーク、API 価格、コストパフォーマンスの検討
Anthropic が発表した最新モデル「Claude Sonnet 5」は、ブラウザやターミナルを自律的に操作する機能を備え、既存の Sonnet 4.6 をすべての公開ベンチマークで上回った。この新モデルは無料および有料プランのデフォルトとなり、Opus 4.8 とのコストパフォーマンス比較が注目されている。
MarkTechPost·7月1日·★★★★
Vercel上で12万社分のCMOエージェントを運用するOkaraの仕組み
OkaraはVercel上のマルチプロバイダAIスタックを活用し、SEOやSNSなど8つのサブエージェントを統括して12万社以上の企業の成長管理を行うAI CMOである。
Vercel Blog·6月11日·★★★★
Claude Codeと今後の展望
著者はClaude Codeに対し、コード知識不要で月1000ドルを稼ぐWeb/ソフトウェア事業の構築を指示した。AIは複数選択質問を経て、プロ向け500個セットのプロンプト販売を提案し、実装を行った。
One Useful Thing·1月8日·★★★★
GPT-3からGemini 3へ:3年間の進化
筆者はGoogleの新モデル「Gemini 3」をテストし、その高品質さを評価した。ベンチマーク数値ではなく、過去3年間のAIの進歩を具体的に示すため、AI自身にその進化を実演させる手法を用いて比較分析を行っている。
One Useful Thing·11月19日·★★★★