#ゼロショット学習のAIニュース

5件の記事

階躍 StepAudio 2.5 TTS がリリース！誰もが音声監督になれる

階躍は新世代音声生成モデル「StepAudio 2.5 TTS」を発表した。このモデルは、グローバル文脈制御、文中文脈制御、ゼロショット音声複製、全音色制御の3つのコア機能により、より自然で柔軟かつ表現力豊かな音声生成を実現する。

アリババが音声・映像・画像・テキストを処理する多モーダルAIモデル「Qwen3.5-Omni」を発表した。同モデルは音声タスクでGemini 3.1 Proを上回り、訓練なしに音声指示と映像入力からコードを生成する能力を獲得した。

研究チームは、高品質な構造化データ（映像・画像・骨格）の埋め込みと筋電信号を整合させることで、筋電信号の表現品質を向上させ、ウェアラブルデバイスでの連続ジェスチャー予測を可能にするEMBridgeを提案した。

量子コンピューティングの進展やロボット向け基盤モデル、Amazon Auroraの進化、自律型AIの発展など、2025年に読者の注目を集めた記事を紹介。

CLIPを起点に、Zero-shot LearningとVision & Languageの最新研究を網羅的に調査。画像生成AIとも関連する技術動向を解説。