Qwen3.5-Omni、訓練なしで音声・映像からコード生成を習得
アリババが発表した多モーダルモデル「Qwen3.5-Omni」は、音声指示と映像入力からコードを生成する能力を、そのための特定の訓練を経ずに獲得しました。音声タスクではGemini 3.1 Proを上回る性能を示し、モデルの汎化能力と新たな学習メカニズムの可能性を示唆しています。(URL: https://the-decoder.com/qwen3-5-omni-learned-to-write-code-from-spoken-instructions-and-video-without-anyone-training-it-to/)