首页 > 新车报道 > 新车报道 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

新车报道更多>>

顶配12.98万,前排可放平,空间没得挑,带你看五菱星光S 五菱星光S纯电怎么选?全系2C快充+长续航,主打一个安心舒适 长安智造SUV来了!华为百万像素灯+超级混动+智驾,或15万内 奇瑞制造走向全球,正变得犹豫不决? 10天大定破2万,华为智驾+鸿蒙驾舱,豪华MPV新款来了 或10万级,吉利全新硬派SUV曝光,外观炸裂! 全新奔驰来了,未来S级,E级与C级就长这样! 10月份特斯拉涨价,中国网友直呼厚道! 全新途胜L来了,标配8AT,座舱焕然一新 方程豹豹8:用“稀缺性”破解爆款密码! 超详细对比:十六七万预算,马自达EZ-6还是比亚迪汉? 中国车市正在消费升级,却与BBA们无关 成都车展上市新车TOP10,覆盖10-70万区间,总有一款适合你 宾利中国内地及香港、澳门执行总经理安睿轲 解读新欧陆GT 限时一口价15.99万元起!帕萨特380TSI家族越级上市 贾鸣镝:买车不仅是买未来,还是对过去的自己的肯定 吉利百度宁德时代“三巨头”齐站台,极越07限时优惠价19.99万起 华为智界R7展车大规模到店:真正为消费者需求而生的颠覆者 低调的豪车,车长5米1,搭载双电机四驱,503匹马力、续航600公里 奥迪的“狠角色”,车长4979mm,V6双涡轮引擎+8速变速箱,加速4s 法系的“黑马”,车长4805mm,升级高级音响,配1.6T+8AT+双独悬 又一高颜值韩系车,车长4715mm,配27英寸的OLED大屏+2.5T发动机 奇瑞的“爆款”,颜值不输星纪元ES,C-DM插电混动+超级四驱 中型轿车之王,车长5006mm,纯正德系品质,还有副驾驶显示屏 美式超级跑车,全车碳纤维打造,起步1842匹马力,还有手动挡 吉利打造的“爆款”,首月销量12230台,跑高速也静音,续航530km 问界M9五座版将上市,2+3布局,后备厢带小桌板、揽景座椅 日产新款家用中型MPV海外上市,侧滑门,7/8座都有,两种动力 奇瑞风云A9官图曝光,外观很漂亮,带电尾翼,有四驱,插混动力 新款比亚迪宋Pro DM-i将上市,车长4735mm,纯电续航93km