[AINews] Gemma 4 crosses 2 million downloads｜Gemma 4のダウンロード数が200万を突破 | AIニュース最前線

先週木曜日にこの件についてコメントしましたが、Gemma 4 の継続的な展開と週末の好意的なレビューにより、初週でダウンロード数が約 200 万に達しました！ （対照的に、Gemma 3 は過去 1 年間で合計 670 万ダウンロード、Gemma 2 は 2024 年 6 月の発売以降 140 万ダウンロードを記録しています。一方、Qwen 3.5 はフラグシップモデルである 397B-A17B のリリースから約 1 年半を経て、累計で約 2,700 万ダウンロードを獲得しました） Gemma 4 の基調講演はロンドンから 3 日後にライブ配信されますので、今すぐブックマークしておいてください： 別に、Hermes Agent の熱狂についても触れておきます。当社の友人が Hermes と OpenClaw の違いについて良い解説記事を執筆しています。 2026 年 4 月 4 日〜4 月 6 日の AI ニュース。12 のサブレッド、544 件の Twitter（X）投稿を確認し、Discord は追加情報なしでした。AINews のウェブサイトでは過去のすべての号を検索できます。念のため、AINews は現在 Latent Space の一部となっています。メール配信頻度の設定をオン/オフできます！ AI Twitter レビュー Gemma 4 の急速なローカル採用とオンデバイス・オープンモデルの瞬間 Gemma 4 は、鋭い「ローカルファースト」の波を牽引しています：複数の投稿で、Gemma 4 が Hugging Face でトップトレンド／第 1 位のモデルとなっていることが指摘され、単なるリーダーボード上のパフォーマンスだけでなく、その実用性に対する強い熱意が示されています（@ClementDelangue, @GlennCameronjr, @Yampeleg を参照）。最も強力なシグナルは、人々がどのように迅速に消費者向けの Apple ハードウェア上でこれを実行しているかです：@adrgrondin は MLX（Apple の機械学習フレームワーク）を用いて iPhone 17 Pro で Gemma 4 E2B を約 40 トークン/秒で動作させる様子を示し、@enjojoyy も同様の iPhone での展開を報告しました。また、@_philschmid は AI Edge Gallery における Wikipedia クエリ用のスキルを活用した Gemma 4 E2B の活用を強調しています。Red Hat も、@RedHat_AI を通じて、NVFP4（NVIDIA Floating Point 4）および FP8-block フォーマットで量子化された Gemma 4 31B モデルカードを発表し、命令追従評価はライブ中、推論・視覚評価は保留中です。これらの投稿を合わせると、Gemma 4 は単なるオープンソースリリースの一例ではなく、エッジ推論、Apple Silicon ツールチェーン、低摩擦なローカル展開のための参照点として確立されつつあることが示唆されます。 商業的な影響としては、有料チャットサブスクリプションやクラウド依存への圧力が生じています。一部の viral なコメントは単純化されすぎている面もありますが、これは現実のシフトを捉えています。@AlexEngineerAI は、Gemma 4 をローカルで実行することでギャップが十分に埋まり、一部のユーザーにとって Claude のサブスクリプションの魅力が低下すると主張しました。一方、@ben_burtenshaw は、Hugging Face（HF）でホストされたモデルは無料で利用でき、エージェントワークフローの一部を置き換えられると指摘しました。インフラ面では、@ollama が NVIDIA Blackwell GPU をバックエンドとする Ollama Cloud で Gemma 4 をリリースし、自己ホスティングなしで OpenClaw や Claude スタイルのワークフローに対応するツールが利用可能になりました。@osanseviero の注目すべきエコシステム関連投稿は、このローンチにおける連携の広範さを強調しました。Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA、Unsloth、SGLang、Docker、Cloudflare など多様なプレイヤーが関与しており、「オープンモデルの成功」が単に重み（weights）だけでなく、同時並行する下流システムへのサポートに依存していることが改めて示されています。 Hermes Agent の自己改善型エージェントループ、OpenClaw における摩擦、そしてオープンなトレースデータへの推進 今回のバッチにおける主導的なエージェント・フレームワークの話題は「Hermes Agent」でした。核となる物語とは、Nous のシステムが、永続的メモリ（persistent memory）、自己生成・洗練されたスキル、そしてより意見の明確な自己改善ループを組み合わせることで、注目を集めているという点です。@NousResearch による Manim スキルの発表は特に共感を呼んだのは、それが単なる PDF 要約ツールではなく、直ちに理解可能な成果物（技術アニメーションや解説動画）を生み出すエージェント・スキルであることを示したからです。これは、@ErickSky、@lucatac0、@Sentdex、@casper_hansen_、@noctus91 によるデモや反応によってさらに注目されました。@Teknium からの製品アップデートでは、Discord や Telegram ボット向けのスラッシュコマンド（slash-command）によるスキル読み込み機能が追加されました。また、コミュニティツールとして「Hermes HUD」がライブプロセスを tmux パンにマッピングし、@aijoey を介して承認フローを可視化しました。さらに、@Teknium、@nesquena、@magiknono によって複数の WebUI（Web ユーザーインターフェース）統合が登場しています。 OpenClaw との対比は、アーキテクチャとビジネスモデルの脆弱性に焦点を当てており、複数の投稿で両者が直接比較されました。@TheTuringPost はその違いを、「人間が作成したスキル」対「自己形成されるスキル」、「Markdown 形式のメモリ」対「永続的かつ検索可能なメモリスタック」、そして「ゲートウェイ制御プレーン」対「自己改善ループ」と要約しました。この枠組みは、@SnuuzyP、@DoctaDG、@spideystreet といった実務者たちにも支持され、多くの人がオンボーディングの容易さや手動でのスキル調整の減少を挙げています。背景には、Claude のサブスクリプションによるゲートイングと稼働率への高まる不満がありました。@theo は Claude Code が自身のソースコードを分析する際にエラーが発生したと報告し、@Yuchenj_UW と @ratlimit はサービス停止を指摘しました。また、@Yuchenj_UW は 20 ドル/200 ドルのサブスクリプションモデルが、24 時間稼働型のエージェントワークロードには構造的に適合しないと主張しています。この経済的な批判は、@NousResearch が掲げる「オープンソースは不可避である」という主張に対する修辞的な勢いを説明する助けとなります。 技術用語: アーキテクチャ (architecture)、ビジネスモデル (business model)、ゲートウェイ制御プレーン (gateway control plane)、自己改善ループ (self-improving loop)、オンボーディング (onboarding)、サブスクリプション (subscription)、エージェントワークロード (agent workloads) より重要な長期的なテーマは、オープンエージェントのデータでした。@badlogicgames は、PII 対策を備えた Hugging Face データセットとしてコーディングエージェントのセッションを公開するための「pi-share-hf」をリリースし、その後自身のセッションを @badlogicgames を通じて公開しました。@ClementDelangue はこれをオープンソースのフロンティアエージェントにとって欠けている要素として明確に位置づけました：コミュニティはすでにトレース（記録）を生成しているため、データセットについてはクラウドソーシングすべきだという考え方です。これは、@salman_paracha のアジェンティックな相互作用における軌道サンプリング/選別に関する「Signals」論文や、Baseten の主張と明確に結びついています。Baseten は、自己改善型モデルはクリーンなサンドボックスを必要とするのではなく、記録された本番環境のトレースから直接学習すべきだと @baseten を通じて主張しました。これはおそらくここで取り上げられた「エージェント」トレンドの中で最も技術的に実質的なものです：単にハーンネス（制御枠組み）が改善されるだけでなく、実際の使用状況からのトレースキャプチャ、キュレーション、トレーニングを巡る新たなスタックが形成されつつあります。 新研究のシグナル：強化学習、ルーティング、エージェント評価、および小規模な専門モデル ポストトレーニングおよび強化学習（RL）の効率化は、依然として実質的な研究領域として注目されています。@TheTuringPost は、Alibaba の Qwen が採用する FIPO（Future-KL Influenced Policy Optimization：未来 KL 影響ポリシー最適化）について取り上げました。これは、将来のステップに強い影響を与えるトークンにより多くの信用を付与する手法です。報告された結果では、推論トレースが約 4K トークンから 10K+ トークンへと拡張され、AIME（American Invitational Mathematics Examination）でのスコアは約 50% から 56〜58% に向上しました。これは引用された DeepSeekR1-Zero-Math を上回る結果であり、設定によっては o1-mini と同等かそれ以上の性能を示しています。 @finbarrtimbers は、OLMo 3 が同期型強化学習から非同期型強化学習へ移行し、トークン/秒あたりの処理スループットが 4 倍に向上した点について解説しました。その他注目すべき論文の紹介には、@_akhaliq と @HuggingPapers による自己蒸留型 RLVR / RLSD（RLSD：強化学習による自己蒸留）や、@TheAITimeline が提案するパス制約付き MoE（MoE：Mixture of Experts）が含まれます。後者は層間におけるルーティング経路を制限することで統計的効率性を高め、補助的な負荷分散ロスを排除する手法です。 エージェントおよびベンチマーク研究は、おもちゃのようなタスクから離れつつあります。@GeZhang86038849 は XpertBench を紹介し、飽和した試験形式のベンチマークではなく、専門家レベルのオープンエンドなワークフロー評価を明確に標的としています。@TheTuringPost は、ツール利用に関する調査を共有しました。そこでは、単一関数呼び出しから長期ホライゾンのオーケストレーション、再計画、フィードバックループへの進展と、レイテンシやコスト予算といった効率性への懸念が取り上げられています。データ/エンタープライズワークフローにおいては、@CShorten30 が Shreya Shankar の Data Agent Benchmark を指摘しました。これは異種データベースシステムにわたる多段階クエリを対象としたものです。これらはすべて、評価設計が生産環境のエージェント構築者が重視するもの（ワークフロー完了、曖昧さの処理、オーケストレーションの質、コスト）に追いつきつつあるという兆候です。 専門特化型モデルは引き続き強力なケーススタディの根拠を示し続けています：@DavidGFar が公開した SauerkrautLM-Doom-MultiVec-1.3M は、31K 枚の人間プレイフレームでトレーニングされた 130 万パラメータの ModernBERT-Hash モデルであり、VizDoom タスクにおいてはるかに大きな API アクセス可能な大規模言語モデル（LLM）を上回る性能を発揮しながら、CPU 上で 31 ミリ秒で動作します。この結果は狭い範囲に限定されていますが、重要な点は、適切にスコープを定義されたモデルは、広範な世界知識よりもレイテンシとアーキテクチャが重要となるリアルタイム制御タスクにおいて支配的になり得るということです。関連して、@MaziyarPanahi は Falcon Perception を推進しました。これは 0.6B のセグメンテーション指向のビジョンランゲージモデルで、SAM 3 と比較して上回る性能を発揮したと報告されており、MacBook で MLX（Apple の機械学習フレームワーク）上で動作します。この点は @Prince_Canuma や @ivanfioravanti によっても支持されました。繰り返されるテーマは、「専門特化性＋より良いシステム適合」が「汎用的なスケール」に勝るということです。 OpenAI と Anthropic：政策シグナリング、ガバナンスの審査、および計算経済 OpenAI の最大の公的な動きは製品ではなく政治的でした。同社とその同盟者は、@kimmonismus、@OpenAINewsroom、@AdrienLE によって要約された、「知能時代のための産業政策」という新たな枠組みを推進しました。主要なアイデアには、公共富基金（Public Wealth Fund）、携帯可能な福利厚生、32 時間労働週間のパイロットプログラム、AI への権利、より強力な出所証明・監査インフラ、危険な公開モデルに対する封じ込めプレイブックが含まれます。注目すべき戦略的メッセージは、OpenAI が現在、スーパーインテリジェンス（超知能）への移行を遠い仮説ではなく、積極的な政策課題として公に主張している点です。反応は賛否両論でした。一部の人はこれを混乱について異例ほど率直だと捉えた一方、他の人々は時期尚早または政治的に都合が良いと見なしました。例えば @Dan_Jeffries1 や @jeremyslevin のような意見があります。また、OpenAI は @OpenAI と @markchen90 を通じてセーフティフェローシップ（安全研究員制度）も開始しました。 同時に、サム・アルトマンと OpenAI のガバナンスに関する監視が激しく強化されました。ニューヨーク誌による大規模な調査報道は、@RonanFarrow や @NewYorker によって拡散され、@ohryansbelt による長文のコミュニティ要約などでも取り上げられました。この報道では、2023 年の解任と再就任の騒動が再検証され、内部文書に関する主張、欺瞞行為の告発、取締役会の操作、安全性プロセスへの懸念、そしてスーパーアライメント（超並列化）へのリソース不足などが指摘されました。OpenAI 側からの反論は @tszzl によって行われ、同氏はアラインメントチームが現在も同社内で最も規模が大きく、計算資源に富むプログラムの一つであると述べました。一方、@anissagardizy8 と @kimmonismus は、アルトマンと CFO のサラ・フライアーとの間に緊張関係があることを報じました。特に計算リソースの支出や IPO（株式公開）への準備を巡る対立が焦点となっています。 アンソロピックの反論は、計算リソースと収益規模でした。@AnthropicAI は Google と Broadcom との間で合意を発表し、2027 年から次世代 TPU（Tensor Processing Unit）の容量が複数ギガワット分稼働開始されることを明らかにしました。これは最先端の Claude モデルを訓練・提供するためです。また、@AnthropicAI によると、同社の年間収益率は 2025 年末の 90 億ドルから 300 億ドルを超えたと発表しています。これに先端的な研究機関における経済的な緊張に関する報道が加わります。@kimmonismus は WSJ の報道を引用し、収益は爆発的に増加している一方で、訓練と推論のコストは依然として膨大であり、OpenAI は 2028 年までに 1,210 億ドルの計算リソースへの支出を見込んでいると指摘しました。エンジニアにとっての実践的な教訓は明白です。最先端を巡る競争はもはやモデルのアイデアだけではボトルネックにならず、資本構造、長期にわたる計算リソース契約、そして提供における経済性が新たな制約となっています。 システムとインフラ：高速な RL（強化学習）、高速な MoE（Mixture of Experts）デコーディング、より優れた GPU/エッジツールリング いくつかの投稿は、システム面での成果について非常に具体的な内容でした。@cursor_ai は「warp decode」という手法により、Blackwell GPU 上で MoE トークン生成が 1.84 倍高速化され、出力品質も向上したと報告しました。これは Composer モデルの更新頻度が高まった結果に直接関連しています。@tri_dao は、実装が行列乗算（matmul）とエピローグとして表現されているためメインループの作業を再利用できることから、高速な Muon オプティマイザのパスが消費者向け Blackwell カードにも導入されると指摘しました。RL の側面では、@finbarrtimbers が OLMo 3 の RL スタックを非同期化してスループットを 4 倍向上させた工程について、稀なエンジニアリング事後分析（postmortem）を提供しました。 Apple/ローカルスタックおよびトレーニング/推論教育エコシステムも継続的に改善されました：@josephjojoe は、Apple Silicon 上のタンパク質モデリング向けに ESM-2 の MLX ポートをオープンソース化し、ローカルでの生物系大規模言語モデル（bio-LLM）の実験範囲を広げました。@rasbt は、LLM アーキテクチャギャラリーに RSS フィードを追加し、モデル設計の最新情報を追跡するための小さくても有用な生活の質向上を実現しました。@UnslothAI は、その無料ノートブックで 500 以上のモデルをトレーニング/実行できるようになったと発表しました。より深いシステム理解のためには、@levidiamode が Hugging Face の「Ultra-Scale Playbook」を高く評価しており、これは DP（データ並列）、TP（テンソル並列）、PP（パイプライン並列）、EP（エピソード並列）、コンテキスト並列を統合し、最大 512 GPU にわたる経験則に基づくスケーリング証拠と結びつけたものです。 エンゲージメント上位のツイート Gemma 4 のオンデバイスデモ：@adrgrondin が iPhone 17 Pro で MLX を用いて Gemma 4 E2B を約 40 トークン/秒で動作させる様子を披露した技術的バイラル投稿が際立っていました。 Claude のサブスクリプションとローカルオープンモデルの代替：@AlexEngineerAI は、多くのワークフローにおいてローカルオープンモデルがすでに「十分良い」状態にあるという世論を捉えました。 オープンソースへの姿勢：@NousResearch が「オープンソースは不可避である」という言葉で、より広範な動きを要約しました。 Claude の停止とゲート化への反発：@ratlimit、@theo、@Yuchenj_UW は共同して、稼働率とサブスクリプション経済を主要なエンジニアリングの苦情へと転換させました。 OpenAI のガバナンス調査：@RonanFarrow と @ohryansbelt が、その日最大の技術に隣接する企業ガバナンスストーリーを主導しました。 Anthropic の計算リソース規模：@AnthropicAI がマルチギガワットの TPU 容量を発表し、同社が年間収益率 300 億ドルを引用したことは、フロンティア・ラボ（最先端研究機関）規模を示す最も明確なシグナルの一つでした。 AI Reddit レビュー /r/LocalLlama + /r/localLLM レビュー 1. Gemma 4 モデルのローンチとベンチマーク 続きを読む

Gemma 4のダウンロード数が200万を突破

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト