首页 > 科学

AI视频生成告别默剧时代！谷歌Veo 3一步生成高质量音画大片，rap、电影、动画片都拿捏

谷歌最强视频生成模型 Veo 3 鲨疯了！

这一次，从画面到对白，全都由 AI 原生直接生成。

不仅可以拿捏各种影视风格——

请看 VCR（花式演绎 "We can talk！"）。

还能搞定大段 rap ——

视频中的 Flow 只需简单一句话就能搞定，比如 " 让老人谈论宇宙 "。

从画面到口型再到音频，完全以假乱真了。

还在发布会现场，谷歌 DeepMind CEO 哈萨比斯就激动宣布：

我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景，还能指定对白和语气。

而通过官方 demo，我们也看到了 Veo 3 电影级的音视频能力：

目前 Veo 3 已在 Gemini 应用程序中面向 Google AI Ultra 订阅用户开放，企业用户可以在 Vertex AI 平台调用。

虽然距离发布会结束才几小时，但一大波网友试玩已新鲜出炉——

说唱、洗脑神曲、烹饪节目花式整活

一上来，脑洞大开的网友们就开始搞起了抽象……

提示词：a video with dialogue of two muffins while baking in an over, the first muffin says "I can ’ t believe this Veo 3 thing can do dialogue now!", the second muffin says "AAAAH, a talking muffin!"

两个松饼表情丰富地开始了对话，连口型都能完美对上：

还复古了上世纪 80 年代的烹饪节目，并带来全新互动方式：

提示词（中译版）：一段 20 世纪 80 年代复古电视烹饪节目的视频，主持人是一位 65 岁左右的英国老太太。她正把面团放在面前的台面上擀着，说道：" 现在，这得费点劲儿…… " 然后，面团变成了一张脸，抬头看着她，用布鲁克林口音说道：" 嘿，女士，看着点！我正在努力膨胀。" VHS 录像带中的噪音

虽然最后一句话本该是面团的台词（未完全遵照提示），但制作该视频的网友仍然被效果惊到了。