#gemma のAIニュース
24件の記事
Amazon Bedrock に Google DeepMind の「Gemma 4」モデルシリーズが追加
Google DeepMind が開発したオープンウェイトの AI モデル「Gemma 4」シリーズ(31B、26B-A4B、E2B)が、Amazon Bedrock で利用可能になった。
Google DeepMind、ローカルAIを4倍高速化する拡散モデル「DiffusionGemma」を公開
Google DeepMindは、従来の逐次生成ではなくテキストブロックを並列生成する新モデル「DiffusionGemma」を発表し、Nvidia DGXやゲーミングGPUなどのローカル環境で処理速度を4倍に向上させたと発表した。
Gemma 4 12B の紹介:統一型エンコーダー非搭載マルチモーダルモデル
Google DeepMind が、エンコーダーを不要とした新しいマルチモーダルモデル「Gemma 4 12B」を発表した。このモデルは画像とテキストの両方を処理できる統合型アーキテクチャを採用している。
Gemma 4 QAT モデル:モバイルおよびラップトップの効率化のためのモデル圧縮最適化(4 分読了)
Google は、モバイルやラップトップでの効率を高めるため、量子化学習(QAT)で最適化した Gemma 4 チェックポイントを公開した。この更新により、メモリ要件が大幅に削減されつつもモデルの品質は維持される専用モバイル量子化フォーマットが含まれている。
Google Colab CLI の紹介
Google は、開発者や AI エージェントがローカル端末からリモート Colab ランタイムに接続し、高機能 GPU を要求して Python スクリプトをシームレスに実行できる新ツール「Google Colab CLI」を発表した。
Google の新モデル「Gemma 4 12B」は 16GB RAM のノート PC で動作可能に設計
Google は、メモリ消費を抑えた新しい生成 AI モデル「Gemma 4 12B」を発表した。このモデルは、一般的な消費者向けノートパソコン(RAM 16GB)でも実行できるように最適化されており、ローカルでの AI 利用を促進するものである。
Gemma 4 12B:開発者ガイド
Google が、消費者向けデバイスでの高性能なローカル AI 実行を目的とした高密度マルチモーダルモデル「Gemma 4 12B」を発表し、従来の視覚・音声エンコーダーを不要とする新アーキテクチャを採用した開発者向けのガイドを提供した。
Google AI Edge を活用した Gemma 4 12B のローカル導入:ラップトップで実行可能なエージェント型ワークフローの実現
Google DeepMind は、メモリ 16GB の一般的なラップトップでも動作する「Gemma 4 12B」モデルを発表し、macOS 上で Google AI Edge Gallery を介してローカルデータ処理や視覚的洞察生成を可能にするエージェント型 AI ワークフローを提供している。
より賢くなったGoogle AI Edge Gallery:MCP統合、通知機能、セッション継続性の追加
GoogleはAndroid向けAIエッジギャラリーアプリにオープンソースのモデルコンテキストプロトコル(MCP)の実験的サポートを追加し、Gemma 4が外部データソースと連携して複雑なタスクを調整可能にした。これにより、より能動的で継続的なユーザー体験が可能になった。
LiteRT-LMによるオンデバイス生成AIの高速化
Google AI Edgeが提供する「LiteRT-LM」は、Gemma 4モデルをモバイルやエッジ環境で実行するための最適化インフラであり、メモリ効率の高い動的読み込みとマルチトークン予測により、最大2.2倍の速度向上を実現し、オンデバイスでの多機能・エージェント機能を解放する。
Google Tensor SDK Beta と LiteRT の発表
Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。
Google の Gemma 4 公開 AI モデルが「推測デコーディング」により最大 3 倍高速化
Google は、Gemma 4 公開モデルに実験的なマルチトークン予測ドラフターを実装し、未来のトークンを推測する「推測デコーディング」技術を採用することで、生成速度を最大 3 倍向上させたと発表した。
Gemma 4 の推論速度を加速:マルチトークン予測ドラフターによる高速化
Google が開発した Gemma 4 モデルは、専用のスペキュレーティブ・デコーディングアーキテクチャを採用し、出力品質や推論ロジックを損なうことなく最大3倍の速度向上を実現しました。これにより、開発者向けの遅延ボトルネックが解消され、応答性が大幅に改善されています。
【AIニュース】2026年4月版 主要ローカルモデル一覧
RedditのローカルLLMコミュニティを調査し、ベンチマーク結果ではなく実際のユーザー推薦に基づいたトップモデルを選定。Qwenなどを例示し、多様なサイズ帯のモデルを網羅したリストを提供している。
Google、ローカルファーストのオンデバイスAI推論に焦点を当てたGemma 4をリリース
GoogleはGemma 4をリリースし、コーディングから本番環境までのソフトウェアライフサイクル全体をサポートするモデル群を通じて、Android開発向けのローカルで自律的なAIを実現することを目指している。
Googleがオフラインで動作するAI音声入力アプリを静かにローンチ
GoogleがGemma AIモデルを活用したオフライン対応の音声入力アプリを発表し、Wispr Flowなどの競合アプリに対抗する。
Gemma 4のダウンロード数が200万を突破
GoogleのGemma 4は公開初週で約200万回のダウンロードを記録した。これは前モデルGemma 3の年間670万回、Gemma 2の140万回を下回る数字だが、Qwen 3.5の2700万回と比較すると依然として低い。今週伦敦で開催されるGemma 4のキーマノートに向けて注目が集まっている。
GoogleがiOS向けオフラインファーストAI音声入力アプリを静かにリリース
GoogleがGemma AIモデルを活用したオフラインファーストの音声入力アプリをiOS向けにリリースし、Wispr Flowなどの競合アプリに対抗する。
Google AI エッジギャラリー
GoogleがiPhone上でGemma 4シリーズのモデルを直接実行できる公式アプリ「Google AI エッジギャラリー」をリリース。E2Bモデルは2.54GBで高速かつ実用的。画像に関する質問や音声の字幕生成機能も搭載。
Google、オープンモデルファミリーGemma 4を発表
Googleは、高度な推論とマルチモーダル機能を備えたオープンモデルファミリー「Gemma 4」を発表した。
Gemma 4:バイト単位で最も能力の高いオープンモデル
GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。
Sakana AI、Googleとの戦略的パートナーシップ締結を発表
Sakana AIはGoogleと戦略的パートナーシップを締結し、資金調達を実施した。両社はGoogleのインフラとSakana AIの研究開発力を組み合わせ、日本のAIエコシステム発展と信頼性の高いAI普及を推進する。
Gemma Scope 2:AI安全コミュニティが複雑な言語モデルの挙動理解を深める支援
GoogleはGemma 3ファミリー全体でGemma Scope 2をリリースし、言語モデルの解釈可能性ツールを公開した。これによりAI安全コミュニティが複雑な言語モデルの挙動をより深く理解できるよう支援する。
Gemmaミートアップ初開催
Googleが開発した軽量オープンソース言語モデルGemmaのコミュニティイベントが初めて開催された。