#モデル圧縮 のAIニュース
9件の記事
クラウドフレア、アンサンブル AI の人材を招いて AI チームを拡大
クラウドフレアは、アンサンブル AI の主要メンバーを採用し、大規模な AI モデルの効率的な実行を支援するインフラ開発を加速させる。
Cloudflare Blog·6月15日·★★★★
学習中にAIモデルをより軽量かつ高速にする新技術
MITの研究者が、AIモデルの学習中にモデルを軽量化・高速化する新技術を開発した。従来は大規模モデルの学習後に縮小するか、小規模モデルで性能を犠牲にする必要があったが、この技術は学習プロセス自体を効率化する。
MIT ML News·4月9日·★★★★
量子化の基礎から解説
Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。
Simon Willison Blog·3月27日
グリーンIT:AIの環境への影響を軽減する方法
AI研究者のLudi Akue氏は、AIが環境に与える影響(大量のエネルギー消費、GPUの短寿命など)を軽減するため、モデル圧縮や量子化などの技術を提案した。
InfoQ·3月26日
Googleが新AIメモリ圧縮アルゴリズム「TurboQuant」を発表、ネットでは「Pied Piper」と話題に
GoogleがAIの作業メモリを最大6倍圧縮する新アルゴリズム「TurboQuant」を発表したが、現時点では実験段階である。
TechCrunch AI·3月26日
クアルコム、スマートフォン向け思考モデルのAI推論チェーンを2.4倍圧縮
クアルコムAIリサーチが、スマートフォン上で推論可能な言語モデルを実現するモジュラーシステムを開発し、モデルの冗長な思考プロセスを2.4倍圧縮した。
The Decoder·3月20日·★★★★
Multiverse Computing、圧縮AIモデルを主流に押し上げる
Multiverse Computingは、OpenAIやMetaなどの主要AIラボのモデルを圧縮した後、圧縮モデルの能力を示すアプリと、より広く利用可能にするAPIを両方リリースした。
TechCrunch AI·3月19日
OpenAI、16MB「パラメータゴルフ」チャレンジでモデル圧縮を人材発掘に転換
OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。
The Decoder·3月19日·★★★★
スペインの『スーニコーン』企業Multiverse Computing、無料圧縮AIモデルを公開
スペインのスタートアップMultiverse Computingが、Hugging FaceでHyperNova 60Bモデルの新版を公開。Mistralのモデルを上回る性能を主張。
TechCrunch AI·2月25日·★★★★