#エッジai のAIニュース
39件の記事
公式発表!阶跃と千里科技、全面戦略的パートナーシップを締結
阶跃と千里科技は、自動運転用基盤モデルの共同開発で戦略的パートナーシップを締結した。両社はAIが物理世界を直接理解する技術の実現を目指す。
Chrome拡張機能でTransformers.jsを使用する方法
開発者はChrome拡張機能にTransformers.jsを組み込み、ブラウザ上で機械学習モデルを実行する。これによりサーバー依存を排除し、プライバシー保護と低レイテンシを実現する実装手順を示す。
ParaRNN:並列学習可能な大規模非線形RNN
アップル研究所は、RNNの並列学習手法「ParaRNN」を開発し、数十億パラメータ規模の大規模RNN学習を初めて可能にした。これにより推論効率の高いモデル設計の選択肢が広がった。
NVIDIA Jetson上で大規模モデルを動作させるためのメモリ効率最適化
NVIDIAはJetsonプラットフォーム上で大規模生成AIモデルを動作させるため、メモリ効率を最適化する技術を提供し、開発者のエッジデプロイメントを支援している。
PyCon US 2026 in Long Beachに参加しよう - 今年は新たなAIとセキュリティトラックを導入
PyCon US 2026が5月にロングビーチで開催され、Pythonコミュニティが新たなAIとセキュリティのトラックを導入する。
UberがAWSとの提携を拡大しAI能力を構築
UberはAWSのAIチップを活用して、リアルタイム運用とAIモデル開発を改善する。
Googleがオフラインで動作するAI音声入力アプリを静かにローンチ
GoogleがGemma AIモデルを活用したオフライン対応の音声入力アプリを発表し、Wispr Flowなどの競合アプリに対抗する。
スペインのスタートアップXoople、AI向け衛星構築に1億3000万ドルを調達
スペインのスタートアップ企業Xoopleが、AIを物理世界に安全に接続するための衛星構築に1億3000万ドルを調達した。同社は「地球システム記録」によりAIと現実世界の連携を強化するとしている。
GoogleがiOS向けオフラインファーストAI音声入力アプリを静かにリリース
GoogleがGemma AIモデルを活用したオフラインファーストの音声入力アプリをiOS向けにリリースし、Wispr Flowなどの競合アプリに対抗する。
Google AI エッジギャラリー
GoogleがiPhone上でGemma 4シリーズのモデルを直接実行できる公式アプリ「Google AI エッジギャラリー」をリリース。E2Bモデルは2.54GBで高速かつ実用的。画像に関する質問や音声の字幕生成機能も搭載。
自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」
Preferred Networksは、経済産業省とNEDOのプロジェクト支援を受け、自律稼働デバイス向けの高精度軽量Vision Language Model「PLaMo 2.1-VL」を開発した。8Bサイズと2Bサイズの2モデルを提供し、デバイス上での動作を可能にした。
Gemma 4:バイト単位で最も能力の高いオープンモデル
Google DeepMindが、2B、4B、31Bサイズの3つの視覚対応推論LLMと、26B-A4BのMixture-of-Expertsモデル、計4つのApache 2.0ライセンスのオープンモデルを発表した。同社は「パラメータあたりの知能レベルが前例ない」と強調し、小型で有用なモデルの開発が現在の研究の最重要分野の一つであることを示している。
GoogleのGemma 4が初めてApache 2.0ライセンスで利用可能に
Googleが最も高性能なオープンモデルファミリー「Gemma 4」をリリースした。4つの新モデルはスマートフォンからワークステーションまで幅広く動作し、初めて完全にオープンなApache 2.0ライセンスで提供される。
Gemma 4でAIをエッジおよびオンデバイスに近づける
NVIDIAが最新のマルチモーダル・多言語モデル「Gemma 4」を発表し、クラウドからエッジデバイスまで幅広い展開に対応するモデルを提供した。
Ring、AI活用でホームセキュリティを超えた新アプリストアを発表
Ringは新アプリストアを立ち上げ、高齢者ケアやビジネスニーズなど、セキュリティ以外の幅広い用途への展開を目指す。
Cohereがエッジデバイス向けオープンソース音声モデルを発表
Cohereは、20億パラメータのオープンソース音声認識モデル「Cohere Transcribe」を発表した。同モデルはエッジデバイスでの展開を想定している。
Mistralが音声生成の新たなオープンソースモデルをリリース
Mistralがスマートウォッチやスマートフォン上で動作可能な新たな音声生成オープンソースモデルをリリースした。
NVIDIA DRIVEにおける集中型レーダー処理がより安全でスマートなレベル4自律走行を実現する方法
NVIDIAが、NVIDIA DRIVEプラットフォームで集中型レーダー処理を実装し、従来のカメラと同等の生データを機械学習エンジニアが扱えるようにすることで、レベル4自律走行の安全性と知能性を向上させている。
NVIDIA IGX Thorが産業・医療・ロボティクスのエッジAIアプリケーションを強化
NVIDIAがIGX Thorプラットフォームを発表し、産業・医療・ロボティクス分野で高性能AIを活用して作業効率や人間と機械の相互作用を向上させるエッジAIアプリケーションを強化する。
QCon London 2026: エッジでのAI実行 - ブラウザで直接実ワークロードを実行
QCon London 2026でJames Hallが、ブラウザで直接AIワークロードを実行する手法について発表した。Transformers.jsやWebGPUなどの技術を活用し、プライバシー強化、遅延・コスト削減などの利点を説明した。
エッジ環境におけるローカルVLMを用いたセキュアOCR:文法制約による構造化出力の実現
ABEJAの伊藤祐希氏が、エッジ環境でVision Language Modelを使用し、文法制約(JSON Schema)を適用することで、セキュアな構造化データ抽出が可能であることを検証した。
クアルコム、スマートフォン向け思考モデルのAI推論チェーンを2.4倍圧縮
クアルコムAIリサーチが、スマートフォン上で推論可能な言語モデルを実現するモジュラーシステムを開発し、モデルの冗長な思考プロセスを2.4倍圧縮した。
Multiverse Computing、圧縮AIモデルを主流に押し上げる
Multiverse Computingは、OpenAIやMetaなどの主要AIラボのモデルを圧縮した後、圧縮モデルの能力を示すアプリと、より広く利用可能にするAPIを両方リリースした。
Appleの「LLM in a Flash」を活用してQwen 397Bをローカルで実行する自動研究
研究者のDan Woodsが、Appleの「LLM in a Flash」技術を応用し、通常209GB(量子化後120GB)のQwen3.5-397B-A17Bモデルを48GB MacBook Pro M3 Maxで5.5+トークン/秒で動作させることに成功した。
Nemotron 3 Nano 4B:効率的なローカルAIのためのコンパクトハイブリッドモデル
NVIDIAが、ローカル環境での効率的なAI実行を可能にするコンパクトなハイブリッドモデル「Nemotron 3 Nano 4B」を発表した。
Mistralの新モデルSmall 4、128の専門家モジュールで高性能を発揮
Mistral AIがMistral Small 4をリリースした。同モデルは高速なテキスト応答、論理的推論、画像処理を統合し、128の専門家モジュールを搭載している。
ハードウェアの視点から見たAI安全性
レノボのエンジニアが、ラップトップやPC上でパーソナルエージェントを構築・展開する際の安全性問題について検討している。
自律走行車とロボティクスのためのエッジファーストLLMで次世代物理AIを構築
NVIDIAが、自律走行車やヒューマノイドロボット向けに、エッジファーストの大規模言語モデルを用いた次世代物理AIの開発を進めている。
Sakana AI、防衛イノベーション科学技術研究所からの委託研究を開始
Sakana AI株式会社は、防衛装備庁防衛イノベーション科学技術研究所と委託研究契約を締結し、陸・海・空の全領域で発生する膨大なデータを統合分析するシステムを開発し、指揮統制システムの高度化を目指す。
Granite 4.0 1B Speech:コンパクトで多言語対応、エッジ向けに構築
IBMがGranite 4.0 1B Speechを発表した。これは、エッジデバイス向けに設計されたコンパクトで多言語対応の音声AIモデルである。
Qwen3.5の小型サイズモデルがリリースされました!
通义实验室がQwen3.5の小型サイズモデル(0.8B/2B/4B/9B)を発表し、Apache 2.0ライセンスで商用利用可能なオープンソースとして提供する。消費級グラフィックカードで動作し、LoRA/全量微調に対応することで、低コストでの垂直シナリオ実装を支援する。
オープンソースのPi監視サーバーをFrigateでアップグレード
筆者が2024年に構築したPi Frigate NVRを、Coral TPUによる物体検知機能を維持しつつ、大容量ハードドライブを活用した小型化アップグレードを実施した。
アップル、今年後半にヒューストンでMac miniの製造を開始
アップルがヒューストンの工場でMac miniの米国初生産とAIサーバー製造を拡大し、現地雇用を創出する計画を発表。
Jetson上でのオープンソース視覚言語モデル(VLM)のデプロイ
Jetsonプラットフォームでオープンソースの視覚言語モデルを効率的にデプロイする方法について解説。
ロンドン証券取引所:ラズベリーパイ・ホールディングス株式会社
英国のラズベリーパイ・ホールディングス株式会社の株価が火曜日に急騰したことを示すグラフが掲載されています。
UnslothとHugging Face Jobsで無料でAIモデルをトレーニング
UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。
Transformers.js v4 プレビュー版がNPMで利用可能に!
Transformers.js v4のプレビュー版がNPMで公開されました。最新バージョンではパフォーマンス向上と新機能が追加されています。
チャットボットを超えて:信頼できるAIのための青写真
Google開発者エキスパートチームがサンダーヒル・レースウェイパークで「信頼できるAIフレームワーク」をテストした。
日経コンピュータ・日経xTECHでエクサウィザーズの機械学習エンジニアによる連載を掲載
日経コンピュータがエクサウィザーズの機械学習エンジニアによる連載を開始し、AI技術の最新動向と応用事例を解説している。第5回ではエクサウィザーズのサヒリ・モハメッドと浅谷学嗣が、エッジデバイス向けAIモデルの軽量化手法について論じた。