#open source llm のAIニュース

6件の記事

VibeThinker-3B:Qwen2.5-Coder-3Bを基盤にスペクトルから信号へのポストトレーニングパイプラインで構築された 30 億パラメータの密着型推論モデル

中国の新浪微博研究所が開発した「VibeThinker-3B」は、大規模なパラメータ数に依存しない効率的なアプローチを採用し、検証可能なタスクにおいて数百倍サイズのモデルと同等の性能を発揮する 30 億パラメータの推論モデルとして公開された。

MarkTechPost·6月20日·★★★★

IPO 直前のアンソロピック、AI 支出への批判に直面

企業顧客が AI 投資の見直しを迫る中、アンソロピックは高コストへの懸念から収益リスクに直面している。調査では顧客の 40% がコスト削減効果が 10% に満たないと回答しており、安価なモデルやオープンソースへの移行が脅威となっている。

TLDR AI·6月3日·★★★★

[AINews] NVIDIA Cosmos 3、Nemotron 3 Ultra、RTX Spark の発表

NVIDIA は今日、言語・画像・動画・音声・動作を統合する「Cosmos 3」を発表した。同モデルは推論と生成を組み合わせたアーキテクチャを採用し、Nano や Super など複数のサイズで提供される。

Latent Space·6月2日·★★★★★

私が構築してきたもの:ATOMレポート、ポストトレーニング講座、書籍の完成、そして継続的な研究

著者はATOMレポート、RLHF関連書籍の完成、ポストトレーニング講座の制作、および技術研究といった最近の取り組みを総括し、その目的と成果について説明している。

Interconnects·4月15日

本日の動向:ArceeのTrinity-Large-ThinkingとZ.aiのGLM-5V-Turboなど

ArceeはApache 2.0ライセンスで400B/13BのTrinity-Large-Thinkingを公開し、PinchBenchで2位を獲得した。Z.aiはマルチモーダル融合のGLM-5V-Turboをリリースし、TIIもオープン語彙のFalcon Perceptionを提供した。

Smol AI News·4月1日·★★★★

GPT-OSS-120Bに論理クイズや数学問題を解かせ、推論ログを詳細に分析した

オープンソースの大規模言語モデルGPT-OSS-120Bに論理クイズや数学問題を解かせ、その推論プロセスをログから詳細に分析した研究内容。

ABEJA Tech Blog·12月24日