メインコンテンツへスキップ

#効率化 のAIニュース

11件の記事

FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!

通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。

通义大模型·4月7日·★★★★

Googleが新AIメモリ圧縮アルゴリズム「TurboQuant」を発表、ネットでは「Pied Piper」と話題に

GoogleがAIの作業メモリを最大6倍圧縮する新アルゴリズム「TurboQuant」を発表したが、現時点では実験段階である。

TechCrunch AI·3月26日

OpenAI、16MB「パラメータゴルフ」チャレンジでモデル圧縮を人材発掘に転換

OpenAIは研究者に対し、わずか16MBで最高の言語モデル構築を競う「パラメータゴルフ」チャレンジを開始し、この競技会を通じて人材スカウトを実施している。

The Decoder·3月19日·★★★★

DeNA × AI Day 2026 イベントレポート ── 内定者が見たAIオールインの現在地

DeNAが2026年3月6日に「DeNA × AI Day 2026 Proof.」を開催し、AIオールイン宣言から1年後の成果を3ステージ構成で発表した。

DeNA Engineering·3月19日

TrajTok:軌跡トークンの学習により動画理解が向上

研究者らが、動画モデルの効率と拡張性を向上させるため、外部パイプラインに依存しない統合型トークナイザー「TrajTok」を提案した。

Apple Machine Learning·3月17日·★★★★

Perplexity、GoogleやAlibabaに匹敵する埋め込みモデルをメモリコスト大幅削減でオープンソース化

AI検索エンジンのPerplexityは、GoogleやAlibabaのモデルに匹敵する性能を通常のメモリコストの一部で実現する2つの新しいテキスト埋め込みモデルをオープンソースとして公開した。

The Decoder·2月28日·★★★★

研究が示す、推論モデルが解決策を超えて考えがちな理由

AI推論モデルは、最適な停止点を過ぎても推論を続ける傾向があり、効率性と過剰思考のバランスが課題となっています。

The Decoder·2月26日·★★★★

AI活用を安定させる型「Diff-in / Merge-out」〜翻訳タスクで学ぶ責務の分離〜

LayerXのエンジニアyoheiが、AI開発ツールの進化を受け、翻訳タスクにおける責務分離の型「Diff-in / Merge-out」を提案し、AI活用の安定化を目指す。

LayerX Tech Blog·12月17日

オン・ポリシー蒸留

ケビン・ルーらによる、思考機械におけるオン・ポリシー蒸留の研究についての記事。

Thinking Machines Lab·10月27日·★★★★

Google Gemma 2のリリース

Googleがパラメータ数20億、90億、270億の3種類のGemma 2を発表。270億パラメータで、その2倍以上の規模のモデルを上回る性能を実現。Ollamaで簡単に実行可能。

Ollama Blog·6月27日·★★★★

図解リトリーバルトランスフォーマー

最新の言語モデルは、データベースやウェブ検索を活用することで小型化しつつGPT-3並みの性能を実現。リトリーバルトランスフォーマーが鍵となる技術。

Jay Alammar·1月3日·★★★★