#gemma のAIニュース

24件の記事

Amazon Bedrock に Google DeepMind の「Gemma 4」モデルシリーズが追加

Google DeepMind が開発したオープンウェイトの AI モデル「Gemma 4」シリーズ（31B、26B-A4B、E2B）が、Amazon Bedrock で利用可能になった。

AWS Machine Learning Blog·6月16日·★★★★

Google DeepMind、ローカルAIを4倍高速化する拡散モデル「DiffusionGemma」を公開

Google DeepMindは、従来の逐次生成ではなくテキストブロックを並列生成する新モデル「DiffusionGemma」を発表し、Nvidia DGXやゲーミングGPUなどのローカル環境で処理速度を4倍に向上させたと発表した。

Ars Technica AI·6月11日·★★★★

Gemma 4 12B の紹介：統一型エンコーダー非搭載マルチモーダルモデル

Google DeepMind が、エンコーダーを不要とした新しいマルチモーダルモデル「Gemma 4 12B」を発表した。このモデルは画像とテキストの両方を処理できる統合型アーキテクチャを採用している。

Google DeepMind·6月9日

Gemma 4 QAT モデル：モバイルおよびラップトップの効率化のためのモデル圧縮最適化（4 分読了）

Google は、モバイルやラップトップでの効率を高めるため、量子化学習（QAT）で最適化した Gemma 4 チェックポイントを公開した。この更新により、メモリ要件が大幅に削減されつつもモデルの品質は維持される専用モバイル量子化フォーマットが含まれている。

TLDR AI·6月8日

Google Colab CLI の紹介

Google は、開発者や AI エージェントがローカル端末からリモート Colab ランタイムに接続し、高機能 GPU を要求して Python スクリプトをシームレスに実行できる新ツール「Google Colab CLI」を発表した。

Google Developers AI·6月5日·★★★★

Google の新モデル「Gemma 4 12B」は 16GB RAM のノート PC で動作可能に設計

Google は、メモリ消費を抑えた新しい生成 AI モデル「Gemma 4 12B」を発表した。このモデルは、一般的な消費者向けノートパソコン（RAM 16GB）でも実行できるように最適化されており、ローカルでの AI 利用を促進するものである。

Ars Technica AI·6月4日·★★★★

Gemma 4 12B：開発者ガイド

Google が、消費者向けデバイスでの高性能なローカル AI 実行を目的とした高密度マルチモーダルモデル「Gemma 4 12B」を発表し、従来の視覚・音声エンコーダーを不要とする新アーキテクチャを採用した開発者向けのガイドを提供した。

Google Developers AI·6月3日·★★★★

Google AI Edge を活用した Gemma 4 12B のローカル導入：ラップトップで実行可能なエージェント型ワークフローの実現

Google DeepMind は、メモリ 16GB の一般的なラップトップでも動作する「Gemma 4 12B」モデルを発表し、macOS 上で Google AI Edge Gallery を介してローカルデータ処理や視覚的洞察生成を可能にするエージェント型 AI ワークフローを提供している。

Google Developers AI·6月3日·★★★★

より賢くなったGoogle AI Edge Gallery：MCP統合、通知機能、セッション継続性の追加

GoogleはAndroid向けAIエッジギャラリーアプリにオープンソースのモデルコンテキストプロトコル（MCP）の実験的サポートを追加し、Gemma 4が外部データソースと連携して複雑なタスクを調整可能にした。これにより、より能動的で継続的なユーザー体験が可能になった。

Google Developers AI·5月19日·★★★★

LiteRT-LMによるオンデバイス生成AIの高速化

Google AI Edgeが提供する「LiteRT-LM」は、Gemma 4モデルをモバイルやエッジ環境で実行するための最適化インフラであり、メモリ効率の高い動的読み込みとマルチトークン予測により、最大2.2倍の速度向上を実現し、オンデバイスでの多機能・エージェント機能を解放する。

Google Developers AI·5月19日·★★★★

Google Tensor SDK Beta と LiteRT の発表

Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。

Google Developers AI·5月19日·★★★★

Google の Gemma 4 公開 AI モデルが「推測デコーディング」により最大 3 倍高速化

Google は、Gemma 4 公開モデルに実験的なマルチトークン予測ドラフターを実装し、未来のトークンを推測する「推測デコーディング」技術を採用することで、生成速度を最大 3 倍向上させたと発表した。

Ars Technica AI·5月7日·★★★★

Gemma 4 の推論速度を加速：マルチトークン予測ドラフターによる高速化

Google が開発した Gemma 4 モデルは、専用のスペキュレーティブ・デコーディングアーキテクチャを採用し、出力品質や推論ロジックを損なうことなく最大3倍の速度向上を実現しました。これにより、開発者向けの遅延ボトルネックが解消され、応答性が大幅に改善されています。

TLDR AI·5月6日·★★★★

【AIニュース】2026年4月版主要ローカルモデル一覧

RedditのローカルLLMコミュニティを調査し、ベンチマーク結果ではなく実際のユーザー推薦に基づいたトップモデルを選定。Qwenなどを例示し、多様なサイズ帯のモデルを網羅したリストを提供している。

Latent Space·4月14日

Google、ローカルファーストのオンデバイスAI推論に焦点を当てたGemma 4をリリース

GoogleはGemma 4をリリースし、コーディングから本番環境までのソフトウェアライフサイクル全体をサポートするモデル群を通じて、Android開発向けのローカルで自律的なAIを実現することを目指している。

InfoQ·4月14日·★★★★

Googleがオフラインで動作するAI音声入力アプリを静かにローンチ

GoogleがGemma AIモデルを活用したオフライン対応の音声入力アプリを発表し、Wispr Flowなどの競合アプリに対抗する。

TechCrunch AI·4月8日

Gemma 4のダウンロード数が200万を突破

GoogleのGemma 4は公開初週で約200万回のダウンロードを記録した。これは前モデルGemma 3の年間670万回、Gemma 2の140万回を下回る数字だが、Qwen 3.5の2700万回と比較すると依然として低い。今週伦敦で開催されるGemma 4のキーマノートに向けて注目が集まっている。

Latent Space·4月7日·★★★★