#動画生成 ai のAIニュース
4件の記事
xAI の「Grok Imagine Video 1.5」が AI Gateway で利用可能に
xAI が開発した動画生成モデル「Grok Imagine Video 1.5」が、AI Gateway で利用可能になりました。このモデルは入力画像から同期された音声付き動画を単一パスで生成し、音質やプロンプトの精度、人物の一貫性が向上しています。
Vercel Blog·6月3日·★★★★
AI で他人の YouTube ショートをリミックス可能に
Google は Gemini Omni を活用した新機能「YouTube Shorts リミックス」を発表し、ユーザーが他の人の動画クリップを再スタイルしたり、自分自身を動画に挿入したりできるようになった。
The Verge AI·5月21日·★★★★
Google、動画生成向け新「Omni」モデルをテスト中
Google は動画と画像生成ツールを統合する新モデル「Omni」を Gemini の UI でテストしており、2026 年の Google I/O での公開も検討されている。
TLDR AI·5月4日·★★★★
StereoFoley:映像から物体認識型ステレオ音声を生成するフレームワーク
研究者らは、映像から意味的に整合し時間同期された空間正確なステレオ音声を 48kHz で生成する「StereoFoley」というフレームワークを発表した。既存モデルがモノラルに限定される中、この手法は物体認識に基づく立体音像を実現する。
Apple Machine Learning·4月28日·★★★★