#エッジai のAIニュース

39件の記事

公式発表！阶跃と千里科技、全面戦略的パートナーシップを締結

阶跃と千里科技は、自動運転用基盤モデルの共同開発で戦略的パートナーシップを締結した。両社はAIが物理世界を直接理解する技術の実現を目指す。

阶跃星辰·4月23日

Chrome拡張機能でTransformers.jsを使用する方法

開発者はChrome拡張機能にTransformers.jsを組み込み、ブラウザ上で機械学習モデルを実行する。これによりサーバー依存を排除し、プライバシー保護と低レイテンシを実現する実装手順を示す。

Hugging Face Blog·4月23日·★★★★

ParaRNN：並列学習可能な大規模非線形RNN

アップル研究所は、RNNの並列学習手法「ParaRNN」を開発し、数十億パラメータ規模の大規模RNN学習を初めて可能にした。これにより推論効率の高いモデル設計の選択肢が広がった。

Apple Machine Learning·4月23日·★★★★

NVIDIA Jetson上で大規模モデルを動作させるためのメモリ効率最適化

NVIDIAはJetsonプラットフォーム上で大規模生成AIモデルを動作させるため、メモリ効率を最適化する技術を提供し、開発者のエッジデプロイメントを支援している。

NVIDIA Developer Blog·4月21日·★★★★

PyCon US 2026 in Long Beachに参加しよう - 今年は新たなAIとセキュリティトラックを導入

PyCon US 2026が5月にロングビーチで開催され、Pythonコミュニティが新たなAIとセキュリティのトラックを導入する。

Simon Willison Blog·4月18日

UberがAWSとの提携を拡大しAI能力を構築

UberはAWSのAIチップを活用して、リアルタイム運用とAIモデル開発を改善する。

AI Business·4月8日

Googleがオフラインで動作するAI音声入力アプリを静かにローンチ

GoogleがGemma AIモデルを活用したオフライン対応の音声入力アプリを発表し、Wispr Flowなどの競合アプリに対抗する。

TechCrunch AI·4月8日

スペインのスタートアップXoople、AI向け衛星構築に1億3000万ドルを調達

スペインのスタートアップ企業Xoopleが、AIを物理世界に安全に接続するための衛星構築に1億3000万ドルを調達した。同社は「地球システム記録」によりAIと現実世界の連携を強化するとしている。

AI Business·4月8日

GoogleがiOS向けオフラインファーストAI音声入力アプリを静かにリリース

GoogleがGemma AIモデルを活用したオフラインファーストの音声入力アプリをiOS向けにリリースし、Wispr Flowなどの競合アプリに対抗する。

TechCrunch AI·4月7日

Google AI エッジギャラリー

GoogleがiPhone上でGemma 4シリーズのモデルを直接実行できる公式アプリ「Google AI エッジギャラリー」をリリース。E2Bモデルは2.54GBで高速かつ実用的。画像に関する質問や音声の字幕生成機能も搭載。

Simon Willison Blog·4月6日

自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」

Preferred Networksは、経済産業省とNEDOのプロジェクト支援を受け、自律稼働デバイス向けの高精度軽量Vision Language Model「PLaMo 2.1-VL」を開発した。8Bサイズと2Bサイズの2モデルを提供し、デバイス上での動作を可能にした。

Preferred Networks·4月3日·★★★★

Gemma 4：バイト単位で最も能力の高いオープンモデル

Google DeepMindが、2B、4B、31Bサイズの3つの視覚対応推論LLMと、26B-A4BのMixture-of-Expertsモデル、計4つのApache 2.0ライセンスのオープンモデルを発表した。同社は「パラメータあたりの知能レベルが前例ない」と強調し、小型で有用なモデルの開発が現在の研究の最重要分野の一つであることを示している。

Simon Willison Blog·4月3日·★★★★

GoogleのGemma 4が初めてApache 2.0ライセンスで利用可能に

Googleが最も高性能なオープンモデルファミリー「Gemma 4」をリリースした。4つの新モデルはスマートフォンからワークステーションまで幅広く動作し、初めて完全にオープンなApache 2.0ライセンスで提供される。

The Decoder·4月3日·★★★★

Gemma 4でAIをエッジおよびオンデバイスに近づける

NVIDIAが最新のマルチモーダル・多言語モデル「Gemma 4」を発表し、クラウドからエッジデバイスまで幅広い展開に対応するモデルを提供した。

NVIDIA Developer Blog·4月3日·★★★★

Ring、AI活用でホームセキュリティを超えた新アプリストアを発表

Ringは新アプリストアを立ち上げ、高齢者ケアやビジネスニーズなど、セキュリティ以外の幅広い用途への展開を目指す。

TechCrunch AI·3月31日

Cohereがエッジデバイス向けオープンソース音声モデルを発表

Cohereは、20億パラメータのオープンソース音声認識モデル「Cohere Transcribe」を発表した。同モデルはエッジデバイスでの展開を想定している。

AI Business·3月27日

Mistralが音声生成の新たなオープンソースモデルをリリース

Mistralがスマートウォッチやスマートフォン上で動作可能な新たな音声生成オープンソースモデルをリリースした。

TechCrunch AI·3月26日·★★★★

NVIDIA DRIVEにおける集中型レーダー処理がより安全でスマートなレベル4自律走行を実現する方法

NVIDIAが、NVIDIA DRIVEプラットフォームで集中型レーダー処理を実装し、従来のカメラと同等の生データを機械学習エンジニアが扱えるようにすることで、レベル4自律走行の安全性と知能性を向上させている。

NVIDIA Developer Blog·3月26日·★★★★

NVIDIA IGX Thorが産業・医療・ロボティクスのエッジAIアプリケーションを強化

NVIDIAがIGX Thorプラットフォームを発表し、産業・医療・ロボティクス分野で高性能AIを活用して作業効率や人間と機械の相互作用を向上させるエッジAIアプリケーションを強化する。

NVIDIA Developer Blog·3月24日·★★★★

QCon London 2026: エッジでのAI実行 - ブラウザで直接実ワークロードを実行

QCon London 2026でJames Hallが、ブラウザで直接AIワークロードを実行する手法について発表した。Transformers.jsやWebGPUなどの技術を活用し、プライバシー強化、遅延・コスト削減などの利点を説明した。

InfoQ·3月24日

エッジ環境におけるローカルVLMを用いたセキュアOCR：文法制約による構造化出力の実現

ABEJAの伊藤祐希氏が、エッジ環境でVision Language Modelを使用し、文法制約（JSON Schema）を適用することで、セキュアな構造化データ抽出が可能であることを検証した。

ABEJA Tech Blog·3月23日·★★★★

クアルコム、スマートフォン向け思考モデルのAI推論チェーンを2.4倍圧縮

クアルコムAIリサーチが、スマートフォン上で推論可能な言語モデルを実現するモジュラーシステムを開発し、モデルの冗長な思考プロセスを2.4倍圧縮した。

The Decoder·3月20日·★★★★

Multiverse Computing、圧縮AIモデルを主流に押し上げる

Multiverse Computingは、OpenAIやMetaなどの主要AIラボのモデルを圧縮した後、圧縮モデルの能力を示すアプリと、より広く利用可能にするAPIを両方リリースした。

TechCrunch AI·3月19日

Appleの「LLM in a Flash」を活用してQwen 397Bをローカルで実行する自動研究

研究者のDan Woodsが、Appleの「LLM in a Flash」技術を応用し、通常209GB（量子化後120GB）のQwen3.5-397B-A17Bモデルを48GB MacBook Pro M3 Maxで5.5+トークン/秒で動作させることに成功した。

Simon Willison Blog·3月19日·★★★★

Nemotron 3 Nano 4B：効率的なローカルAIのためのコンパクトハイブリッドモデル

NVIDIAが、ローカル環境での効率的なAI実行を可能にするコンパクトなハイブリッドモデル「Nemotron 3 Nano 4B」を発表した。

Hugging Face Blog·3月18日·★★★★

Mistralの新モデルSmall 4、128の専門家モジュールで高性能を発揮

Mistral AIがMistral Small 4をリリースした。同モデルは高速なテキスト応答、論理的推論、画像処理を統合し、128の専門家モジュールを搭載している。

The Decoder·3月17日

ハードウェアの視点から見たAI安全性

レノボのエンジニアが、ラップトップやPC上でパーソナルエージェントを構築・展開する際の安全性問題について検討している。

AI Business·3月13日

自律走行車とロボティクスのためのエッジファーストLLMで次世代物理AIを構築

NVIDIAが、自律走行車やヒューマノイドロボット向けに、エッジファーストの大規模言語モデルを用いた次世代物理AIの開発を進めている。

NVIDIA Developer Blog·3月13日·★★★★

Sakana AI、防衛イノベーション科学技術研究所からの委託研究を開始

Sakana AI株式会社は、防衛装備庁防衛イノベーション科学技術研究所と委託研究契約を締結し、陸・海・空の全領域で発生する膨大なデータを統合分析するシステムを開発し、指揮統制システムの高度化を目指す。

Sakana AI·3月13日

Granite 4.0 1B Speech：コンパクトで多言語対応、エッジ向けに構築

IBMがGranite 4.0 1B Speechを発表した。これは、エッジデバイス向けに設計されたコンパクトで多言語対応の音声AIモデルである。

Hugging Face Blog·3月10日·★★★★

Qwen3.5の小型サイズモデルがリリースされました！

通义实验室がQwen3.5の小型サイズモデル（0.8B/2B/4B/9B）を発表し、Apache 2.0ライセンスで商用利用可能なオープンソースとして提供する。消費級グラフィックカードで動作し、LoRA/全量微調に対応することで、低コストでの垂直シナリオ実装を支援する。

通义大模型·3月3日·★★★★

オープンソースのPi監視サーバーをFrigateでアップグレード

筆者が2024年に構築したPi Frigate NVRを、Coral TPUによる物体検知機能を維持しつつ、大容量ハードドライブを活用した小型化アップグレードを実施した。

Andrej Karpathy 厳選·2月28日

アップル、今年後半にヒューストンでMac miniの製造を開始

アップルがヒューストンの工場でMac miniの米国初生産とAIサーバー製造を拡大し、現地雇用を創出する計画を発表。

Andrej Karpathy 厳選·2月25日·★★★★

Jetson上でのオープンソース視覚言語モデル(VLM)のデプロイ

Jetsonプラットフォームでオープンソースの視覚言語モデルを効率的にデプロイする方法について解説。

Hugging Face Blog·2月24日·★★★★

ロンドン証券取引所：ラズベリーパイ・ホールディングス株式会社

英国のラズベリーパイ・ホールディングス株式会社の株価が火曜日に急騰したことを示すグラフが掲載されています。

Andrej Karpathy 厳選·2月23日

UnslothとHugging Face Jobsで無料でAIモデルをトレーニング

UnslothとHugging Face Jobsを活用することで、効率的かつ無料でAIモデルのトレーニングが可能になります。

Hugging Face Blog·2月20日

Transformers.js v4 プレビュー版がNPMで利用可能に！

Transformers.js v4のプレビュー版がNPMで公開されました。最新バージョンではパフォーマンス向上と新機能が追加されています。

Hugging Face Blog·2月9日·★★★★

チャットボットを超えて：信頼できるAIのための青写真

Google開発者エキスパートチームがサンダーヒル・レースウェイパークで「信頼できるAIフレームワーク」をテストした。

Google Developers AI·1月29日·★★★★

日経コンピュータ・日経xTECHでエクサウィザーズの機械学習エンジニアによる連載を掲載

日経コンピュータがエクサウィザーズの機械学習エンジニアによる連載を開始し、AI技術の最新動向と応用事例を解説している。第5回ではエクサウィザーズのサヒリ・モハメッドと浅谷学嗣が、エッジデバイス向けAIモデルの軽量化手法について論じた。

ExaWizards Tech Blog·9月13日