#動画生成 ai のAIニュース

4件の記事

xAI の「Grok Imagine Video 1.5」が AI Gateway で利用可能に

xAI が開発した動画生成モデル「Grok Imagine Video 1.5」が、AI Gateway で利用可能になりました。このモデルは入力画像から同期された音声付き動画を単一パスで生成し、音質やプロンプトの精度、人物の一貫性が向上しています。

Google は Gemini Omni を活用した新機能「YouTube Shorts リミックス」を発表し、ユーザーが他の人の動画クリップを再スタイルしたり、自分自身を動画に挿入したりできるようになった。

Google は動画と画像生成ツールを統合する新モデル「Omni」を Gemini の UI でテストしており、2026 年の Google I/O での公開も検討されている。

研究者らは、映像から意味的に整合し時間同期された空間正確なステレオ音声を 48kHz で生成する「StereoFoley」というフレームワークを発表した。既存モデルがモノラルに限定される中、この手法は物体認識に基づく立体音像を実現する。