#video generation のAIニュース

19件の記事

バイトダンスの新型 AI 動画モデル「Seedance 2.5」が単一プロンプトで 30 秒間の映像を生成可能に

バイトダンスは、単一のテキスト指示だけで 4K 解像度・30 秒間の動画を生成できる新モデル「Seedance 2.5」を発表した。ユーザーは最大 50 の画像や動画などを参照素材として指定でき、中国では来月提供開始予定である。

アリババのAI動画モデルが世界ランキング2位に浮上、OpenAIのSoraやバイトダンスのSeedanceは後退

アリババグループが開発した「HappyHorse 1.1」というAI動画生成モデルが、企業向けAPIを通じて本格的な動画制作を可能にし、世界ランキングで2位にランクインしました。このモデルはテキストや画像からの動画生成に加え編集機能も備え、アリババクラウド上で利用可能です。

TLDR AI·6月23日·★★★★

MolmoMotion：言語指示に基づく 3D モーション予測モデルの公開

Allen AI は、物体の未来の動きを予測するオープンソースの言語ガイド付き 3D モデル「MolmoMotion」を発表した。この技術はロボット工学や動画生成など、次なる出来事を推論するシステムにおける運動予測能力を強化する。

Allen AI (AI2)·6月17日·★★★★

ハリウッドの未来は、バニラ型生成 AI モデルにプロンプトを入力するだけでは実現しない

The Verge は、生成 AI が映画業界を革命化するとの騒ぎにもかかわらず、実際に観客が支払って見る価値のある作品がほとんど生まれていないと指摘し、単純なプロンプト入力では不十分だと論じている。

The Verge AI·6月13日

安価・高速・文化的配慮あり、インドの規模向けに設計された Avataar の動画 AI

Avataar は、コスト削減と処理速度の向上に加え、インドの文化特性を反映した動画生成 AI を開発し、同国の大規模な需要に対応する製品を発表しました。

TechCrunch AI·6月12日·★★★★

動画エージェントモデルが次世代へ — xAI のイーサン・ヘ氏に聞く Grok Imagine の開発秘話（98 分読み）

Nvidia コスモス世界モデルの元リーダー、イーサン・ヘ氏が xAI に移籍し、3 ヶ月で「Grok Image」を構築した経緯について、動画生成やマルチモーダル技術の最前線における実務の核心を語っている。

TLDR AI·6月2日·★★★★

Hugging Face リポジトリの Lance（軽量ネイティブ統合マルチモーダルモデル）

Hugging Face が公開した「Lance」は、画像・動画の理解・生成・編集に対応する 30 億パラメータの軽量モデルであり、128 台の A100 GPU を用いてゼロから訓練された。

TLDR AI·5月25日·★★★★

Grok Imagine Video 1.5 のプロンプト作成方法

Replicate が、X（旧 Twitter）の AI「Grok」が生成する動画モデル「Imagine Video 1.5」を効果的に操作するためのプロンプト作成ガイドを発表した。

Replicate·5月21日·★★★★

[AINews] Google I/O 2026：Gemini 3.5 Flash、Omni（動画用 NanoBanana）、Spark（背景エージェント）、Antigravity 2.0 の発表

Google は I/O 2026 で、音声・動画・画像処理に特化した新モデル「Gemini Live」「Omni」「Pics/Flow」や背景エージェント「Spark」、および「Antigravity 2.0」を発表し、業界をリードする多モーダル技術の進展を示した。

Latent Space·5月20日·★★★★★

映像言語モデルに映画の語り方を教える研究

カーネギーメロン大学の研究者らが、視覚言語モデルに対して映画の構成や表現方法を学習させる手法を提案した。

ML@CMU·5月14日

Google の Gemini Omni ビデオモデルが I/O デビュー前に登場、チャット内で動画編集機能を統合

Google は次期イベント「I/O」に先駆け、チャット内で動画のリミックスや編集を直接行える新モデル「Gemini Omni video model」を発表した。このモデルは透かし除去や物体の差し替えなどの編集能力に優れるが、ByteDance の Seedance 2 に比べると映画のような画質では劣る。今後は Flash や Pro といった階層版として展開され、多様なモダリティを Gemini で統一する戦略の一環となる見込みである。

TLDR AI·5月12日·★★★★

正規化フローを用いたエンドツーエンド動画生成モデル「STARFlow-V」の発表

研究チームは、計算コストが高い動画生成領域において拡散モデルに代わる手法として、正規化フローに基づく新しい動画生成モデル「STARFlow-V」を発表した。

Apple Machine Learning·4月30日·★★★★

AI動画は序章に過ぎないか？RunwayのCEOが「世界モデル」を次世代と指摘

ニューヨークの企業RunwayのCEOは、生成AI動画が単なる novelty から創造的ツールへ急速に進化したと述べ、同社がGoogleやOpenAIと競合する中、次世代技術として「世界モデル」への移行が必要だと主張している。

TechCrunch AI·4月30日·★★★★

Veo 3.1 Lite の構築：最もコスト効率の高い動画生成モデル

Google は、Gemini API および Google AI Studio で Veo 3.1 Lite の有料プレビューとテストを開始した。これは同社が提供する最もコスト効率の高い動画生成モデルである。

Google AI Blog·4月1日·★★★★

HeyGenのモデルがfalプラットフォームで利用可能に

動画生成AI企業のHeyGenは、そのモデルをfalプラットフォーム上で提供開始した。これにより、話すアバター生成や多言語唇同期などの機能を利用可能となった。

fal.ai Blog·3月3日

Kling 3.0がfalプラットフォームで提供開始

動画・画像生成モデル「Kling 3.0」がfalプラットフォームで提供開始された。最大6ショットのストーリーボードやキャラクターの一貫性維持など、構造化された物語作成に対応する最新技術スタックを実現した。

fal.ai Blog·2月5日·★★★★

音声と映像を完璧に融合、一つのシーンで没入感を | Seedance 1.5 Pro 音声・動画創作モデル正式リリース

バイトダンスのSeedチームが、音声と映像を統合的に生成・編集できる創作モデル「Seedance 1.5 Pro」を正式にリリースし、視聴覚体験の新たな可能性を開いた。

字节跳动Seed·12月16日·★★★★

Stable Video 4D 2.0：単一動画からの高忠実度新視点合成と4D生成の新アップグレード

Stability AIがStable Video 4Dを2.0にアップグレードし、実世界動画からの高品質な4D生成と新視点合成で最先端の結果を達成した。商用・非商用利用可能なライセンスで公開されている。

Stability AI·5月21日·★★★★

動画生成のための拡散モデル

画像合成で成功した拡散モデルが、動画生成に応用され始めている。動画は1フレームの画像を含むため時間的整合性が求められ、技術的に困難な課題である。

Lilian Weng·4月12日·★★★★