メインコンテンツへスキップ

#コード生成 のAIニュース

166件の記事

Copilot 利用状況レポートの精度と網羅性が向上

GitHub は Copilot 利用状況メトリクス API を改善し、CLI の提案行数の報告やサーバー側テレメトリからの IDE 特定、AI クレジット消費の完全な帰属を可能にした。

GitHub Changelog·7月3日·★★★★

Meta が静かに「Pocket」というバイブコーディング対応ゲームアプリをリリース

Meta は、バイブコーディング(自然言語によるコード生成)を活用した新しいゲームアプリ「Pocket」を正式に公開しました。同社は開発効率向上を目指し、この機能をゲーム制作ツールとして導入しています。

TechCrunch AI·7月3日·★★★★

頭を痛めずにアプリを構築できる 5 つの AI コーディングプラットフォーム

KDnuggets は、開発者がストレスなくアプリケーションを構築するために役立つ 5 つの AI コーディングプラットフォームを紹介した。

KDnuggets·7月1日

エージェントと人間が一致したコードを実装できるよう支援する CLI ツール「konsistent」がオープンソース化

Vercel が TypeScript コードベース向けの構造的規約を強制する CLI リンター「konsistent」のオープンソース化を発表し、AI エージェントと開発者が一貫した文脈で機能を実装できるように支援すると発表した。

Vercel Blog·7月1日

Sakana Fugu、Claude 禁止後に LiveCodeBench で 93.2 のスコアを記録しリリース

Sakana AI が開発した「Fugu」モデルが、Claude の利用制限後に公開され、LiveCodeBench ベンチマークで 93.2 という高いスコアを獲得しました。

TLDR AI·6月30日·★★★★

[AINews] OpenAI、2025年11月以降の内部Codex出力トークン数が研究で56倍、カスタマーサポートで32倍に急増と報告

OpenAIが経済調査レポートを発表し、2025年11月以降、社内でのCodex利用状況が劇的に拡大したことを示しました。特に研究部門では出力トークン数が56倍に、エンジニアリング部門でも27倍に増加しています。

Latent Space·6月26日·★★★★

Figma が新アップデートでコードレイヤーやアニメーションサポート、さらに AI 機能を追加

デザインツール「Figma」が新アップデートにより、開発者が直接編集可能なコードレイヤーの導入、アニメーション機能のサポート強化、および新たな AI 機能の実装を発表した。

TechCrunch AI·6月25日·★★★★

2026 年にローカルで実行可能なトップ 7 つのコーディングモデル

KDnuggets が選定した、2026 年版のローカル環境で動作する主要な 7 つのコード生成 AI モデルを紹介している。

KDnuggets·6月24日

OpenAI、長時間実行タスクにおける Codex の性能最大化を発表

OpenAI は、長時間実行する作業において Codex のパフォーマンスを最適化する方法について発表した。

OpenAI News·6月22日

Salesforce CodeGen チュートリアル:ユニットテストと安全性チェック付きの Python 関数の生成・検証・再ランク付け

Salesforce は Hugging Face からモデルを読み込み、自然言語から Python 関数を生成するエンドツーエンドワークフローを公開した。この手法には構文チェックや静的解析、ユニットテストによる検証が含まれる。

MarkTechPost·6月19日

Mistral AI が Vibe にコード作成とアプリ機能を提供へ

AI 企業「Mistral AI」は、開発者向けプラットフォーム「Vibe」にコード生成およびアプリケーション構築機能を追加すると発表した。これにより、ユーザーは Vibe 上で直接コード作成やアプリ開発が可能になる。

TLDR AI·6月19日

Microsoft の小規模コーディングモデル「MAI-Code-1-Flash」が GitHub Copilot の利用範囲を拡大

マイクロソフトは、小規模コーディングモデル「MAI-Code-1-Flash」の利用可能領域を拡張し、Copilot CLI、GitHub Mobile、Visual Studio などの主要な開発環境で利用可能になったと発表した。

GitHub Changelog·6月19日·★★★★

今日は何も起こらなかった(GLM-5.2 など新モデル紹介)

智譜(Zhipu)が公開した「GLM-5.2」は、100 万トークンの推論を可能にする革新的なインデックス共有スパースアテンションを採用し、GPT-5.5 や Opus 4.8 に匹敵すると評価された。また、Poolside AI の「Laguna M.1」や Cohere の「North Mini Code」など、長文コーディングやローカル展開に特化した注目すべきオープンモデルも発表された。

Smol AI News·6月18日·★★★★

Claude Code がアーティファクト機能をサポート

Anthropic は開発者向けツール「Claude Code」に、コード生成結果を直接表示・編集できる「アーティファクト」機能を追加した。これにより、開発ワークフローの効率化が図られる。

Claude Blog·6月18日·★★★★

Claude で Replit が利用可能に(2 分読了)

Anthropic の AI チャットボット「Claude」が、コード開発環境「Replit」との連携機能を正式に追加し、ユーザーは Claude 内で直接 Replit を使用できるようになった。

TLDR AI·6月18日·★★★★

OpenAI Codex を活用した 5 つの楽しいプロジェクト

KDnuggets が紹介する記事では、OpenAI のコード生成モデル「Codex」を実際に使用して作成された 5 つの興味深いプロジェクト事例が紹介されています。

KDnuggets·6月17日

Kimi K2.7 Code と Claude Fable 5 の比較:ランディングページ作成コストが 94% 削減

Together AI は、Kimi K2.7 Code モデルと Claude Fable 5 モデルを比較し、ランディングページ作成におけるコストが 94% 削減されることを示した。

Together AI Blog·6月17日

SpaceX が Cursor を 600 億ドルで買収と正式発表

SpaceX は IPO の直後、AI 競合他社との格差を縮め企業顧客の獲得を狙うため、Cursor を 600 億ドルで買収すると発表した。

The Verge AI·6月16日·★★★★★

SpaceX、IPO の直後に Cursor を株式で 600 億ドルで買収へ

宇宙企業 SpaceX が、AI エディタ開発企業の Cursor を株式価値で約 600 億ドルで購入すると発表しました。これは同社の大規模 IPO(新規株式公開)から数日後の出来事です。

TechCrunch AI·6月16日·★★★★★

なぜ Codex は「Codex Design」のような製品をまだ推出していないのか?

宝玉は、開発支援ツール「Codex」がデザイン分野に対応した類似製品(Codex Design)をまだ展開していない理由について疑問を呈している。

宝玉的分享·6月13日

Moonshot AI の「Kimi K2.7 Code」が Vercel AI Gateway で利用可能に

Vercel は、Moonshot AI が開発した長期的コーディングタスク対応の多機能モデル「Kimi K2.7 Code」を自社の AI Gateway に追加し、テキストと画像の入力を同時に処理できる機能を公開しました。

Vercel Blog·6月12日·★★★★

ストリーミング、Pandas、tiktoken を活用した NVIDIA Nemotron-Pretraining-Code-v3 メタデータからのコードデータセットパイプライン構築

MarkTechPost は、NVIDIA の大規模コード事前学習用データセット「Nemotron-Pretraining-Code-v3」のメタデータを対象に、フルダウンロードを避けてストリーミング処理し、Pandas と tiktoken を使用して分析可能なサンプルパイプラインを構築する手法を紹介している。

MarkTechPost·6月10日

開発者向け初のモデル「North Mini Code」の発表:Cohere が Hugging Face で紹介

AI 企業 Cohere は、Hugging Face Blog を通じて、開発者向けの専用モデルとして初めて「North Mini Code」を発表した。この新モデルは、コード生成や技術的タスクの支援を目的としている。

Hugging Face Blog·6月10日·★★★★

「スロッペンハイマー」:アマゾンの従業員が社内チャットで同社の AI を揶揄

アマゾン創業者のジェフ・ベゾスは AI が生産性を飛躍的に高めると信じているが、社内の従業員は AI ツールの出力を「ゴミ(スロップ)」と呼び、同社の動機付け策の失敗をジョークとして嘲笑している。

404 Media·6月9日·★★★★

[AINews] FrontierCode:コードの質を評価するベンチマーク「Slop」への対抗

Latent Space が、AI 生成コードの質を測定する新ベンチマーク「FrontierCode」を発表し、低品質な出力(Slop)との戦いを開始した。

Latent Space·6月9日·★★★★

FrontierCode の紹介:高品質な生産データベース基準にモデルがどれだけ対応できるかを測定するベンチマーク

オープンソースのメンテナーらが作成した「FrontierCode」は、コードの結合可能性を初めて測定するベンチマークであり、敵対的テストや多段階レビューを含む厳格な QC パイプラインを通じて、モデルが高品質で保守可能なコードを書ける能力を示す最も強力な指標を提供します。

TLDR AI·6月9日·★★★★

実装者を信じてはいけない

Algomatic Tech Blog·6月8日

GitHub Copilot、100 万トークンのコンテキストウィンドウと設定可能な推論レベルをサポート

GitHub は開発者向け AI ツール「Copilot」に、最大 100 万トークン分のコンテキストウィンドウと、ユーザーが調整可能な推論レベル機能を追加した。これにより、大規模なコードベースや複雑な多ファイルプロジェクトでも文脈を維持しながら作業が可能になった。

GitHub Changelog·6月5日·★★★★

Google 社員が社内掲示板で AI の不具合を揶揄するミームを共有

Google のCEOサンダル・ピチャイ氏が新コードの75%がAI生成だと主張する一方、同社社員は社内掲示板でAIがそのタスクに不得意で業務を困難にしていると批判するミームを共有している。

404 Media·6月4日·★★★★

Google、Play ストア開発者のコードを AI 訓練用に購入へ

Google は Android アプリ開発者に対し、AI コーディングツールの訓練に使用するコードへのアクセス権を購入する提案を非公式に行っている。

404 Media·6月3日·★★★★

GitHub Copilot の Azure Repos 向けコードレビューが技術プレビュー版として利用可能に

GitHub が、Azure DevOps ワークフローにオンデマンドのプルリクエストレビュー機能を追加する「Copilot for Azure Repos」を技術プレビューとして提供開始した。これにより、開発者はプルリクエストから直接 Copilot にコードレビューを依頼できるようになる。

GitHub Changelog·6月3日·★★★★

Claude Opus 4.8:機能と反応について

Zvi は、新モデル「Claude Opus 4.8」の理解には多数のデータポイントが必要であり、限られたベンチマークからの評価は誤解を招くと指摘し、多様なソースからの数十件のテスト結果やモデルカード情報を統合して初めて一貫したパターンが形成できると述べています。

The Zvi·6月2日·★★★★

JetBrains の Mellum 2(49 分読み)

JetBrains が開発ツール「Mellum」のバージョン 2 を公開し、詳細な機能解説を 49 分間の読了量で提供している。

TLDR AI·6月2日·★★★★

Amazon Bedrock で OpenAI のモデルと Codex が一般利用可能に

AWS は、GPT-5.5、GPT-5.4、および Codex を Amazon Bedrock 上で一般提供開始した。これにより、開発者は同社の高性能推論エンジンを用いて、これらの AI モデルを本番環境のアプリケーションやエージェントへ即時にデプロイできるようになった。

AWS Machine Learning Blog·6月2日·★★★★

間もなく登場する Copilot スーパーアプリの新しいスクリーンショット(2 分読了)

TLDR AI が、Microsoft の Copilot を統合した次世代スーパーアプリの新たなスクリーンショットを公開し、今後の機能や UI 変更について報じた。

TLDR AI·6月1日·★★★★

GitHub Copilot で Claude Opus 4.8 が一般利用可能に

Anthropic の最新モデル「Claude Opus 4.8」が GitHub Copilot で一般提供開始され、コード理解や大規模コードベースの操作能力が向上した。2026 年 6 月 1 日までの間、プレミアムリクエスト数が 15 倍になる特典が付与される。

GitHub Changelog·5月29日·★★★★

Windsurf バージョン 2.3.15 の変更点

Windsurf はバージョン 2.3.15 をリリースし、リモートサーバーの起動タイムアウトを延長するとともに、バンドルされた Devin ローカルエージェントを最新バージョンに更新しました。これにより、エディタで開いているファイルがコンテキストとして認識されるようになりました。

Windsurf Changelog·5月28日

Code w/ Claude London 2026:構築方法の再考

Anthropic はロンドンで開催されたイベントで、コード作成におけるClaude の役割や開発プロセスの見直しについて発表した。

Claude Blog·5月26日·★★★★

Anthropic、Claude Code および Claude Security のための「Mythos 1」を準備中(2 分読了)

Anthropic はモデル「Mythos 1」のより広範な利用に向けて動き出しており、同モデルはすでに Google Cloud や AWS の脆弱性発見プログラムを通じて組織保護に貢献している。また、Claude Opus 4.8 のリリースも噂されている。

TLDR AI·5月25日·★★★★

Mad House — ユズバーン・クリーピー・コンピューターゲーム

Simon Willison は、UK の出版社ユズバーンが1980年代のコンピュータ関連書籍を無料PDFとして公開したことを紹介し、自身が子供の頃にコモドール64で遊んだ思い出を語っている。

Simon Willison Blog·5月25日

VS Code の GitHub Copilot がタスクに応じた自動モデル選択機能を強化

GitHub Copilot は、利用状況やモデルの健全性などのリアルタイム信号を分析し、推論やコード生成の複雑さなどタスクの多様な側面を評価することで、最適なモデルを自動的に選定する機能を VS Code に導入した。

GitHub Changelog·5月21日·★★★★

Google、次期 AI ウェーブをチャットボットではなくエージェントに賭ける「Gemini 3.5 Flash」を発表

Google は新モデル「Gemini 3.5 Flash」を発表し、今後の AI の主流を対話型チャットボットから自律的なエージェントへとシフトさせる戦略を示した。

TechCrunch AI·5月20日·★★★★★

LLM の過去半年を5分で解説

Simon Willison氏がPyCon US 2026で発表した、大規模言語モデルの過去半年の動向をまとめたスライドを紹介する。

Simon Willison Blog·5月19日·★★★★

Cursor が Composer 2.5 をリリース(7 分読)

開発支援ツール「Cursor」が、コード生成機能の強化を含む新バージョン「Composer 2.5」を正式に公開した。

TLDR AI·5月19日·★★★★

Grok Build の紹介:ターミナルから動作するコーディングエージェント

xAI が開発したコーディングエージェント「Grok Build」が、SuperGrok Heavy 契約者のための早期ベータ版として公開されました。このツールはターミナル上で動作し、サブエージェントやヘッドレスモードをサポートしています。

TLDR AI·5月15日·★★★★

Copilot コードレビュー:コメント表示の改善

Microsoft は Copilot のコードレビュー機能を更新し、優先度を示す重大度ラベルやグループ化された提案を追加しました。これにより、ユーザーは不要なノイズを減らし、重要な修正提案を効率的に特定できるようになります。

GitHub Changelog·5月13日·★★★★

バイブコーディングとエージェントエンジニアリングの融合への懸念

著者は、AI コーディングツールのポッドキャスト出演を通じて、自身の業務において「バイブコーディング」と「エージェントエンジニアリング」が思わぬほど接近し始めているという驚きと懸念を表明した。

Simon Willison Blog·5月6日·★★★★

Mistral Medium 3.5 がリモート Vibe エージェントを駆動し、長時間非同期コーディングタスクを可能に

Mistral AI は、128B パラメータの高密度モデル「Mistral Medium 3.5」を発表しました。このモデルは CLI や Le Chat から起動可能なリモート Vibe エージェントを駆動し、クラウド上で複雑な多段階コーディングタスクを実行します。

TLDR AI·4月30日·★★★★

Laguna XS.2 と M.1:詳細解説(20 分読了)

Poolside が公開したコーディング用エージェントモデル「Laguna M.1」と軽量版「XS.2」について、長期タスク対応能力やオープンソース化の概要を解説する。

TLDR AI·4月29日·★★★★

ソフトウェア開発の未来:AI 時代における開発量の減少

Andrew Ng が設立した DeepLearning.AI が主催するカンファレンスで、世界中から集まった 3,000 人以上の開発者が、AI 時代のソフトウェアエンジニアリングが今後どうなるかについて議論しました。

The Register AI/ML·4月29日·★★★★