AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏
谷歌最强视频生成模型 Veo 3 鲨疯了!
这一次,从画面到对白,全都由 AI 原生直接生成。
不仅可以拿捏各种影视风格——
请看 VCR(花式演绎 "We can talk!")。
还能搞定大段 rap ——
视频中的 Flow 只需简单一句话就能搞定,比如 " 让老人谈论宇宙 "。
从画面到口型再到音频,完全以假乱真了。
还在发布会现场,谷歌 DeepMind CEO 哈萨比斯就激动宣布:
我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。
而通过官方 demo,我们也看到了 Veo 3 电影级的音视频能力:
目前 Veo 3 已在 Gemini 应用程序中面向 Google AI Ultra 订阅用户开放,企业用户可以在 Vertex AI 平台调用。
虽然距离发布会结束才几小时,但一大波网友试玩已新鲜出炉——
说唱、洗脑神曲、烹饪节目花式整活
一上来,脑洞大开的网友们就开始搞起了抽象……
提示词:a video with dialogue of two muffins while baking in an over, the first muffin says "I can ’ t believe this Veo 3 thing can do dialogue now!", the second muffin says "AAAAH, a talking muffin!"
两个松饼表情丰富地开始了对话,连口型都能完美对上:
还复古了上世纪 80 年代的烹饪节目,并带来全新互动方式:
提示词(中译版):一段 20 世纪 80 年代复古电视烹饪节目的视频,主持人是一位 65 岁左右的英国老太太。她正把面团放在面前的台面上擀着,说道:" 现在,这得费点劲儿…… " 然后,面团变成了一张脸,抬头看着她,用布鲁克林口音说道:" 嘿,女士,看着点!我正在努力膨胀。" VHS 录像带中的噪音
虽然最后一句话本该是面团的台词(未完全遵照提示),但制作该视频的网友仍然被效果惊到了。

还有我们熟悉的洗脑神曲,连弹舌这种技术活儿都不在话下。 ( ⊙ o ⊙ )
提示词:futuristic russian singer, techo vibes, eclectic tongue thing.
当然,除了这些好玩的,更有古希腊数学家毕达哥拉斯开展新式教学(连小蜜蜂都有)。
提示词:Pythagoras explaining his theorem, in ancient Greece
也能直接用来花式营销,一遍又一遍强调同一个概念,主打一个洗脑。
甚至,凭空手搓一个和小扎的播客节目这样的高难度任务也能实现:
原作者激动表示,再这样下去 Veo 4 就和真的没啥区别了。

而另一边,谷歌首席创意技术专家也透露了一些玩法细节。
他测试了一把 Veo 3 连续生成长视频的能力。
使用首尾帧功能,他最终制作了下面这个 1 分钟左右的视频:
虽然这里的背景音乐不是由 Veo 3 生成的,但男主角的自白和各种音效确实有电影内味儿了。

One More Thing
与此同时,谷歌 Veo 2 也迎来了升级。
最大亮点在于新增了 " 参考视频 " 功能,用来保持视频风格统一以及角色形象一致。


还有相机控制、首尾帧、画面扩展、物体添加 / 移除等其他功能。
这些新功能目前已在 Flow 工具中部分上线,完整版很快将在 Vertex AI 平台推出。
最后,你认为谷歌这次的视频 AI 表现如何呢?
参考链接:
[ 1 ] https://x.com/arikuschnir/status/1924953349943697763
[ 2 ] https://x.com/MartinNebelong/status/1924926779677905014
[ 3 ] https://x.com/AIForHumansShow/status/1924934882930917861
[ 4 ] https://x.com/nearcyan/status/1924963340876710365
[ 5 ] https://x.com/skirano/status/1924957061969834382
— 完 —
量子位 AI 主题策划正在征集中!欢迎参与专题365 行 AI 落地方案,一千零一个 AI 应用,或与我们分享你在寻找的 AI 产品,或发现的AI 新动向。
也欢迎你加入量子位每日 AI 交流群,一起来畅聊 AI 吧~
一键关注 点亮星标
科技前沿进展每日见
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!