[AINews] RIP Pull Requests (2005-2026)｜【AIニュース】プルリクエストの終焉（2005-2026） | AIニュース最前線

コードレビューの死に続くように、プルリクエストも次の対象となるかもしれない。 過去15年でコーディングを学んだ人々にとって、Git、GitHub、そしてプルリクエストのない世界を想像することは難しいが、それ以前の世界が存在したことは事実であり、もしかするとその後の時代も訪れるかもしれない。 プルリクエストは2005年に発明されたと評価されており、GitHubによって広く普及した。そしてわずか21年後、GitHubは歴史上初めて、オープンソースリポジトリにおいてプルリクエストを無効にすることを許可した（以前はイシューのみを無効にできた）。 ![image](https://substackcdn.com/image/fetch/$s_!bm4O!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd974198b-3217-4de1-ae09-e8aba5710e67_1364x708.png) コードにおける生成AIの台頭は、長らくプルリクエストの存続危機を意味してきた。すでにPete Steinberger氏（Theo氏とともに）は、複数の理由（1) マージコンフリクトが発生しない、2) 管理者がコードを確認するよりもプロンプトに修正や追加を加える方が容易である、3) 無害に見えるプルリクエストの中に悪意のあるまたは脆弱なコードが紛れ込む可能性が低い）から、プルリクエストではなくプロンプトリクエストのみを望んでいることで知られている。また、Mitchell Hashimoto氏やAmp Codeのような他の人々は、信頼できないコードの貢献を処理するための「レピュテーション（評判）」ベースのシステムを作成している。 「数兆のエージェントのための構築」において、アロン・レヴィは「今後の道筋は、エージェントが望むソフトウェアを作ることだ」と指摘しました。ヒトは人間同士の協働のためにGitを発明しました。コードの流れから人間のボトルネックを排除した際、Gitベースのワークフローがもはや適切ではない可能性が高まっていることは明白です。 そして、コードレビューが死に、プルレビューも死んだなら……Gitそのものが死んでしまうのはいつのことでしょうか？ 2026年4月14日〜4月15日のAIニュース。私たちは12のサブレディット、544件のTwitter投稿、および追加のDiscordコミュニティを確認しました。AINewsのウェブサイトでは過去の全号を検索できます。念のためお知らせしますが、AINewsは現在Latent Spaceの一部です。メール配信頻度のオプトイン・オプトアウトが可能です！ AI Twitter recap OpenAI Agents SDKの拡張と新しいサンドボックス指向エージェントスタック OpenAIはエージェントハーネスを計算・ストレージから分離し、ファイルやコンピュータの使用、スキル、メモリ、コンパクション（圧縮）のためのプリミティブを用いた、長時間実行かつ耐久性のあるエージェント指向のAgents SDKへと進化させました。ハーネスは現在オープンソース化されカスタマイズ可能であり、@OpenAIDevsのフォローアップおよび@snsfによると、実行はOpenAIインフラと密結合するのではなく、パートナーのサンドボックスに委譲できます。これにより、「Codexスタイル」のエージェントが第三者によってより再現可能になり、差別化要因はオーケストレーション、状態管理、安全な実行へとシフトしました。 そのリリースをきっかけとして、すぐに注目すべきエコシステムが形成されました。@CloudflareDev、@modal、@daytonaio、@e2b、そして @vercel_dev が公式のサンドボックス統合を発表しています。実用的なパターンは、ステートレスなオーケストレーションとステートフルな隔離されたワークスペースの組み合わせに収束しつつあります。すでにいくつかのビルド例が登場しており、@akshat_b による GPU サンドボックス、サブエージェント、永続メモリ、およびフォーク/再開スナップショットを備えた Modal 搭載の ML 研究エージェントや、@whoiskatrin による Python エージェント向け Cloudflare ガイド（サンドボックス内でタスクを実行し、出力をローカルにコピーする）などが挙げられます。 Cloudflare の Project Think、Agent Lee、および Voice Agents Cloudflare は最も活発なエージェントインフラのリリースサイクルの一つを有していました。@whoiskatrin と @aninibread は、Project Think を紹介しました。これは耐久性のある実行（durable execution）、サブエージェント、永続セッション、サンドボックス化されたコード実行、組み込みのワークスペースファイルシステム、およびランタイムでのツール作成を中核とする次世代 Agents SDK です。並行して、@Cloudflare は Agent Lee をリリースしました。これはダッシュボード内のエージェントであり、サンドボックス化された TypeScript を使用して、Cloudflare の UI を手動のタブナビゲーションからプロンプト駆動型の操作へと移行させます。@BraydenWilmoth によって、インフラタスクの発行や UI 支援結果の生成を行う様子が示されました。 音声およびブラウザのツールチェーンもコアスタックに統合されました。@Cloudflare は、WebSockets を介した継続的な STT/TTS 用の実験的なリアルタイム音声パイプラインを提供し、@korinne_dev は、音声を同じエージェント接続上の単なる別の入力チャネルとして位置づけました。ブラウザ自動化については、@kathyyliao がリブランドされた Browser Run スタックを要約しました。これには Live View、人間による介入（human-in-the-loop）、セッション録画、CDP エンドポイント、WebMCP サポート、およびより高い制限値が含まれます。これらを総合すると、Cloudflare は、本格的なエージェントプラットフォームは、耐久性のあるランタイム＋UI によるグラウンディング（grounding）＋ブラウザ＋音声＋サンドボックスの組み合わせであることを強く示唆しています。 Hermes Agent の自己改善ワークフローと競合ポジショニング Hermes Agent の特徴的なアイデアは、ツール使用だけでなく、永続的なスキル形成にあります。@joshesye による中国語の比較では、OpenClaw を GUI 優先で即座に使用できるパーソナルアシスタントとして、Hermes を「プロフェッショナル」なエージェントとして対比させています。Hermes は、完了したワークフローが再利用可能かどうかを判断し、それを自動的に Skill（スキル）に変換します。この「完了したタスクから学習する」という枠組みは繰り返し登場しました：@chooseliberty は、Hermes が追跡データを自動補完し、cron ジョブを更新し、その後ワークフローを再利用可能なスキルとして保存する自律的な例を示しました；@NeoAIForecast は、セッションの健全性（session hygiene）とスレッドの分岐・検索を強調し、これらが Hermes を使い捨てのチャットボックスではなく、本格的な作業環境へと転換するために重要であると指摘しました。 コミュニティの感情は、HermesをOpenClawに対して明確に位置づけており、その表現はしばしば率直なものでした。例えば、@vrloom、@theCTO、@Tekniumらは、Hermesが実際のワークフローで果たした役割を強調しました。その一例として、@elder_pliniusによる現在バイラル（拡散）しているGemma 4の「abliteration」事例が挙げられます。このエージェントは保存されたスキルを読み込み、Gemma 4のNaN（Not a Number）不安定性を診断し、基盤ライブラリにパッチを当て、複数のメソッドを再試行し、結果をベンチマークし、モデルカードを生成し、アーティファクトをHugging Faceにアップロードしました。これに加え、具体的な製品機能の追加もありました。@0xme66による/browser接続を通じたブラウザ制御、@TekniumによるQQBotおよびAWS Bedrockのサポート、@nesquenaによるネイティブSwiftデスクトップアプリのアルファ版、そしてartifact-previewやhermes-lcm v0.3.0などのエコシステムツールリングの継続的な開発です。 モデル、アーキテクチャ、トレーニングのリリース：スパース拡散、ループトランスフォーマー、効率的な長文脈MoE 複数の技術的に意味のあるオープンリリースが、各モーダリティ（データ形式）にわたって行われました。@withnucleusaiは、Nucleus-Imageを発表しました。これは最初のスパースMoE（Mixture of Experts：専門家混合）拡散モデルとして位置づけられており、17Bパラメータ、2Bアクティブパラメータ、Apache 2.0ライセンスで、重み、トレーニングコード、データセットレシピを提供し、diffusersにおけるDay-0サポートも実現しています。NVIDIAはLyra 2.0を発表しました。これは永続的で探索可能な3Dワールドを生成するためのフレームワークで、@NVIDIAAIDevによると、フレームごとの3D幾何学を維持し、自己_augmentedトレーニング（データ拡張）を用いて時間的なドリフト（ずれ）を削減します。マルチモーダル検索については、@thewebAIがwebAI-ColVec1をオープンソース化し、OCRや前処理なしでドキュメント検索においてViDoRe V3のトップパフォーマンスを達成していると主張しています。 計算効率に関するアーキテクチャ研究は特に活発でした。@hayden_prairie、@realDanFu、そして @togethercompute は Parcae を発表しました。これは安定したレイプループ処理型トランスフォーマーの定式化です。その主張は、固定されたパラメータ予算において、ブロックをループ処理することで約2倍の規模を持つモデルと同等の品質を回復でき、FLOPs（浮動小数点演算数）がパラメータやデータだけでなくループ処理を通じてスケールする、新たなスケーリング軸をもたらすというものです。NVIDIA も Nemotron 3 Super を発表しました。@dair_ai による要約によると、これはオープンな120Bのハイブリッド Mamba-Attention MoE（Mixture of Experts：専門家の混合）モデルで、アクティブパラメータは12B、コンテキスト長は1M、25Tトークンで学習されています。GPT-OSS-120B 比で最大2.2倍、Qwen3.5-122B 比で7.5倍のスループットを実現しています。これらのリリースは総じて、メモリ帯域幅とロングコンテキストのスループットが、ますます主要なアーキテクチャ上の目標となっていることを示しています。 Google/Gemini の製品急増：Mac アプリ、パーソナルインテリジェンス、TTS（Text-to-Speech：音声合成）、そしてオープンなマルチモーダルモデル Google は1つのサイクルで複数のリリースを重ねました。最も目立ったのは、@GeminiApp、@joshwoodward、そして @sundarpichai によって発表された Mac 用のネイティブ Gemini アプリです。Option + Space での起動、画面共有、ローカルファイルのコンテキスト利用、Swift によるネイティブ実装、そして幅広い macOS での利用可能性が特徴です。並行して、パーソナルインテリジェンスが Gemini および Chrome でグローバルに展開され、Gmail や Photos などの製品からのシグナルをユーザーが接続できるようになりました。これは @Google と @GeminiApp によって、透明性とユーザー制御型のアプリ接続を軸に位置づけられています。 技術的に興味深いモデル発表として、Gemini 3.1 Flash TTS が挙げられます。@GoogleDeepMind、@OfficialLoganK、@demishassabis はこれを、Audio Tags（音声タグ）、70以上の言語、インラインの非言語的シグナル、マルチスピーカー対応、SynthID 透かし（透かし技術）を備えた、高度に制御可能な TTS（Text-to-Speech：音声合成）モデルとして位置づけました。@ArtificialAnlys による独立した評価では、Speech Arena（スピーチアリーナ）においてトップモデルからわずか4 Elo差の2位にランクインしました。また、Google は @osanseviero 経由で Apache 2.0 ライセンスの下、新しい事前トレーニングレシピを備えた基礎的なテキスト画像エンコーダーである TIPS v2 をオープンソース化しました。コミュニティからは、Google AI の製品リリース速度として非常に密度が高い日付であるとの指摘がありました。 研究シグナル：AI 支援数学、長期ホライゾンエージェント、評価のシフト、オープンデータ 最も示唆に富む研究議論は、AI 支援数学に関するものでした。@jdlichtman は、GPT-5.4 Pro が Erdős 問題 #1196 の証明を生成したと報告しました。これは、長年仮定されていた証明のトリックを拒否し、von Mangoldt 関数（フォン・マンゴルグ関数）を用いた技術的に直感に反する解析的経路を活用することで、専門家たちを驚かせました。@jdlichtman、@thomasfbloom、@gdb などの後続の議論は、これが数学者の広く認めるところとなる初の AI 生成「Book Proof」（ブックプルーフ：簡潔で完全な証明）になる可能性を示唆するものでした。これは単発の結果としてよりも、成熟した研究領域においてモデルが、非審美的ではあるがコンパクトな攻撃経路を occasionally（ときおり）見つけ出すことができるという証拠として重要です。 長期ホライゾンのエージェント研究も、状態管理とハーネス設計の収束を続けています。@omarsar0 は AiScientist をまとめました。これは、スリムなオーケストレーターが File-as-Bus パターンを通じて専用エージェントを調整するもので、このバス（通信経路）を削除すると PaperBench や MLE-Bench Lite の評価結果に重大な悪影響が生じます。@dair_ai は、継続的な小規模モデルの改善ループのための Pioneer Agent を強調し、@yoonholeee は Meta-Harness をオープンソース化しました。これは新しいドメインで堅牢なハーネスを実装するユーザーを支援することを目的としたリポジトリです。評価（evals）については、@METR_Evals が Gemini 3.1 Pro (high thinking) をソフトウェアタスクにおいて約6.4時間の50%タイムホライゾンで推定し、@arena は Document Arena のトップランクが Claude Opus 4.6 Thinking で1位となり、Kimi-K2.5 Thinking がベストなオープンモデルであることを示しました。一方、@TeraflopAI は SEC EDGAR データの43Bトークンを公開し、その日のより広範なオープンデータセットおよびオープンインフラストラクチャへの推進を強化しました。 エンゲージメント（反応）の多いトップツイート Mac 版 Gemini: @sundarpichai と @GeminiApp が、ネイティブデスクトップアプリに関する最大のローンチエンゲージメントを牽引しました。 Gemini 3.1 Flash TTS: @OfficialLoganK と @GoogleDeepMind が、大幅に制御可能な TTS スタックを強調しました。 AI 支援数学証明: @jdlichtman と @gdb が、当日の最も強力な研究議論を引き起こしました。 OpenAI Agents SDK の更新: @OpenAIDevs が、オープンハーネスおよびパートナーサンドボックスへの意味のあるプラットフォームシフトを示しました。 Nature誌に掲載されたAnthropicの潜在学习に関する論文：@AnthropicAIは、トレーニングデータを通じた隠れた特性の伝達について大きな注目を集めました。 AI Reddit recap /r/LocalLlama および /r/localLLM の recap 続きを読む

【AIニュース】プルリクエストの終焉（2005-2026）

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト