#ゼロショット学習 のAIニュース
5件の記事
階躍 StepAudio 2.5 TTS がリリース!誰もが音声監督になれる
階躍は新世代音声生成モデル「StepAudio 2.5 TTS」を発表した。このモデルは、グローバル文脈制御、文中文脈制御、ゼロショット音声複製、全音色制御の3つのコア機能により、より自然で柔軟かつ表現力豊かな音声生成を実現する。
阶跃星辰·4月16日
Qwen3.5-Omniが音声指示と映像からコードを書く方法を誰にも教わらずに習得
アリババが音声・映像・画像・テキストを処理する多モーダルAIモデル「Qwen3.5-Omni」を発表した。同モデルは音声タスクでGemini 3.1 Proを上回り、訓練なしに音声指示と映像入力からコードを生成する能力を獲得した。
The Decoder·3月31日·★★★★
EMBridge:クロスモーダル表現学習による筋電信号からのジェスチャー汎化の向上
研究チームは、高品質な構造化データ(映像・画像・骨格)の埋め込みと筋電信号を整合させることで、筋電信号の表現品質を向上させ、ウェアラブルデバイスでの連続ジェスチャー予測を可能にするEMBridgeを提案した。
Apple Machine Learning·3月3日·★★★★
2025年で最も閲覧されたブログ記事トップ10
量子コンピューティングの進展やロボット向け基盤モデル、Amazon Auroraの進化、自律型AIの発展など、2025年に読者の注目を集めた記事を紹介。
Amazon Science·12月30日·★★★★
Zero-shot Learningの包括的サーベイ:CLIPが切り開いたVision & Languageの新たな地平
CLIPを起点に、Zero-shot LearningとVision & Languageの最新研究を網羅的に調査。画像生成AIとも関連する技術動向を解説。
ExaWizards Tech Blog·5月10日·★★★★