#mixture of experts のAIニュース

4件の記事

EMO：データからモジュール型専門家が自然発生的に出現する事前学習混合専門家モデル

Google が「EMO」と呼ぶ新しい混合専門家モデルを開発し、データからタスク固有の専門家グループが自律的に形成される仕組みを実現した。これにより、ユーザーは全モデル性能を維持しつつ、小規模な専門サブセットを選択して利用できるようになる。

Allen AI (AI2)·5月8日·★★★★

NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に

NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。

AWS Machine Learning Blog·4月29日·★★★★

Amazon SageMaker AIとAmazon BedrockでvLLMを使用して数十のファインチューニングモデルを効率的に提供

vLLMでMixture of ExpertsモデルのマルチLoRA推論を実装し、カーネルレベルの最適化を行い、効率的なモデル提供方法を解説。GPT-OSS 20Bを例に使用。

AWS Machine Learning Blog·2月26日·★★★★

注目すべき2024年のAI研究論文（第1部）

著者が2024年のAI研究のハイライト記事の草稿を完成させた。今年は特に生産的な年であり、専門家混合モデルから新しいLLMスケーリング則まで多様なトピックを扱うが、本記事ではLLM研究に焦点を当てている。

Sebastian Raschka·12月31日·★★★★