#エッジ ai のAIニュース

15件の記事

Liquid AI、非トランスフォーマー型「Liquid Foundation Models 2.5」を公開（230M パラメータ）

Liquid AI は、状態空間と液体ニューラルネットワークに基づく非トランスフォーマーアーキテクチャの「LFM 2.5」を発表した。この 230M パラメータモデルはコンパクトながら、エッジ推論やシーケンス生成でトランスフォーマーの 3 倍サイズのモデルと同等の性能を達成している。

TLDR AI·6月26日·★★★★

Transformers.js で提案されたクロスオリジンストレージ API の実験

Hugging Face が、Transformers.js 環境で提案されているクロスオリジンストレージ API の実装可能性を実験している。

Hugging Face Blog·6月23日

NVIDIA XR AI を用いた AR グラスおよび XR デバイス向け AI エージェントの構築

NVIDIA は、AR グラスや XR デバイス上で動作する AI エージェントを構築するための技術とアプローチを NVIDIA Developer Blog で発表した。

NVIDIA Developer Blog·6月17日·★★★★

Gemma 4 12B の紹介：統一型エンコーダー非搭載マルチモーダルモデル

Google DeepMind が、エンコーダーを不要とした新しいマルチモーダルモデル「Gemma 4 12B」を発表した。このモデルは画像とテキストの両方を処理できる統合型アーキテクチャを採用している。

Google DeepMind·6月9日

データセンターがあなたのマシンへ（4 分読了）

TLDR AI は、従来のクラウド型データセンターから、ユーザーの端末内で処理を行う分散型アーキテクチャへの移行を提案している。これにより、遅延の削減やプライバシー保護が可能になると説明している。

TLDR AI·6月3日·★★★★

Google AI Edge を活用した Gemma 4 12B のローカル導入：ラップトップで実行可能なエージェント型ワークフローの実現

Google DeepMind は、メモリ 16GB の一般的なラップトップでも動作する「Gemma 4 12B」モデルを発表し、macOS 上で Google AI Edge Gallery を介してローカルデータ処理や視覚的洞察生成を可能にするエージェント型 AI ワークフローを提供している。

Google Developers AI·6月3日·★★★★

メモリ効率を重視し、エッジでエージェント対応 AI を展開する NVIDIA JetPack 7.2 の発表

NVIDIA は、AI エージェントが物理環境へ移行する際に実世界での展開を加速させるため、メモリ効率を最適化した「NVIDIA JetPack 7.2」を発表した。これにより、NVIDIA Jetson 上でエッジデバイス向けの実用的な AI エージェントの導入が可能となる。

NVIDIA Developer Blog·6月2日·★★★★

Reachy Mini が完全ローカル動作へ

Hugging Face は、ロボット「Reachy Mini」のソフトウェアをクラウド依存から切り離し、端末上で完全にローカルで動作可能にするアップデートを発表した。これにより、通信環境に依存しない自律制御が可能となる。

Hugging Face Blog·5月27日

ホーム向け Gemini でサービスプロバイダーとハードウェアパートナーを支援

Google は、高度なカメラ知能や自然言語クエリ機能を統合したフルスタックの Gemini AI オファリングを開始し、スマートホームエコシステムを拡大する。これにより、サービスプロバイダーやハードウェアメーカーは、ブランド付きの予防的サービス構築に必要な参考設計と API を利用できるようになる。

Google Developers AI·5月21日·★★★★

Google Tensor SDK Beta と LiteRT の発表

Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。

Google Developers AI·5月19日·★★★★

Cactus Needle（GitHub リポジトリ）：Gemini 3.1 から蒸留された軽量モデルがローカル環境で高速動作

Cactus Needle は、Gemini 3.1 を基に蒸留された 2600 万パラメータの Simple Attention Network モデルであり、Mac や PC でローカルファインチューニングが可能。このモデルは Cactus 上で秒間 6,000 トークンのプレフィルと 1,200 トークンのデコード速度を達成し、スマホやウェアラブル端末向けに AI を再定義する目的で開発された。

TLDR AI·5月13日·★★★★

CyberSecQwen-4B：防衛型サイバーセキュリティには小型・専門化・ローカル実行モデルが不可欠な理由

Qwen ベースの「CyberSecQwen-4B」は、消費者レベルのハードウェア上で動作し、データプライバシーを確保しながら大規模モデルを上回る防御性能を発揮する。この成果は、インフラコストをかけずに高性能を実現する小型専門モデルへの転換を示している。

TLDR AI·5月11日·★★★★

ダイアログブースト：AmazonがAIでテレビ番組や映画の会話を強化する方法

Amazonは、AIを活用した新しい音声処理技術「ダイアログブースト」を開発し、テレビ番組や映画の会話を強化することで、数百万人の視聴者にとって娯楽コンテンツをよりアクセスしやすくしている。

Amazon Science·12月11日·★★★★

Stability AIとArmがスマートフォン向けオンデバイス生成音声を実現

Stability AIとArmは、Arm KleidiAIライブラリとStable Audio Open技術を活用し、インターネット接続不要でスマートフォン上で高品質な音声生成を可能にした。処理速度は30倍向上し、生成時間が数分から数秒に短縮される。2025年3月3日のMWCバルセロナで発表予定。

Stability AI·3月3日·★★★★

Llama 3.2が小型化とマルチモーダル化を実現

OllamaがMetaと提携し、Llama 3.2をOllamaプラットフォームに導入する。

Ollama Blog·9月25日·★★★★