#モデル圧縮のAIニュース

9件の記事

クラウドフレア、アンサンブル AI の人材を招いて AI チームを拡大

クラウドフレアは、アンサンブル AI の主要メンバーを採用し、大規模な AI モデルの効率的な実行を支援するインフラ開発を加速させる。

MITの研究者が、AIモデルの学習中にモデルを軽量化・高速化する新技術を開発した。従来は大規模モデルの学習後に縮小するか、小規模モデルで性能を犠牲にする必要があったが、この技術は学習プロセス自体を効率化する。

Sam Roseが大規模言語モデルの量子化の仕組みをインタラクティブな記事で解説し、浮動小数点数のバイナリ表現についても視覚的に説明している。

AI研究者のLudi Akue氏は、AIが環境に与える影響（大量のエネルギー消費、GPUの短寿命など）を軽減するため、モデル圧縮や量子化などの技術を提案した。

GoogleがAIの作業メモリを最大6倍圧縮する新アルゴリズム「TurboQuant」を発表したが、現時点では実験段階である。

クアルコムAIリサーチが、スマートフォン上で推論可能な言語モデルを実現するモジュラーシステムを開発し、モデルの冗長な思考プロセスを2.4倍圧縮した。

Multiverse Computingは、OpenAIやMetaなどの主要AIラボのモデルを圧縮した後、圧縮モデルの能力を示すアプリと、より広く利用可能にするAPIを両方リリースした。

OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。

スペインのスタートアップMultiverse Computingが、Hugging FaceでHyperNova 60Bモデルの新版を公開。Mistralのモデルを上回る性能を主張。