メインコンテンツへスキップ

#ゼロショット学習 のAIニュース

5件の記事

階躍 StepAudio 2.5 TTS がリリース!誰もが音声監督になれる

階躍は新世代音声生成モデル「StepAudio 2.5 TTS」を発表した。このモデルは、グローバル文脈制御、文中文脈制御、ゼロショット音声複製、全音色制御の3つのコア機能により、より自然で柔軟かつ表現力豊かな音声生成を実現する。

阶跃星辰·4月16日

Qwen3.5-Omniが音声指示と映像からコードを書く方法を誰にも教わらずに習得

アリババが音声・映像・画像・テキストを処理する多モーダルAIモデル「Qwen3.5-Omni」を発表した。同モデルは音声タスクでGemini 3.1 Proを上回り、訓練なしに音声指示と映像入力からコードを生成する能力を獲得した。

The Decoder·3月31日·★★★★

EMBridge:クロスモーダル表現学習による筋電信号からのジェスチャー汎化の向上

研究チームは、高品質な構造化データ(映像・画像・骨格)の埋め込みと筋電信号を整合させることで、筋電信号の表現品質を向上させ、ウェアラブルデバイスでの連続ジェスチャー予測を可能にするEMBridgeを提案した。

Apple Machine Learning·3月3日·★★★★

2025年で最も閲覧されたブログ記事トップ10

量子コンピューティングの進展やロボット向け基盤モデル、Amazon Auroraの進化、自律型AIの発展など、2025年に読者の注目を集めた記事を紹介。

Amazon Science·12月30日·★★★★

Zero-shot Learningの包括的サーベイ:CLIPが切り開いたVision & Languageの新たな地平

CLIPを起点に、Zero-shot LearningとVision & Languageの最新研究を網羅的に調査。画像生成AIとも関連する技術動向を解説。

ExaWizards Tech Blog·5月10日·★★★★