首页 > 新车报道 > 新车报道 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

新车报道更多>>

美车企海外业务萎缩 专家警告:福特、通用或沦为小众制造商 谷歌正解决Gmail邮箱垃圾、广告邮件分类错误问题 OPPO周意保否认网传Find X9 Ultra图片 称后续将官宣 AI竞赛正在金融化:七巨头把算力之争打成资本战 苹果三星超薄旗舰全部大降价:三星S25 Edge暴降2500元 全网疯转,Claude Code之父神级代码首次公开!10亿美金秘密来了 消息称苹果iPhone Air目前累积激活不到20万台 特斯拉Model 3推出8000元限时保险补贴,支持7年超低息 奥尔特曼宣布OpenAI启动Codex发布月,官网揭秘AI智能体循环 比亚迪新款海鸥亮相:首次可选激光雷达 A股春季行情短期进入主升阶段?券商策略来了 官方发布十大新规整治“内卷式”竞争:覆盖网购外卖平台、新能源车等 超30位核心高管出走!复盘Google 2025年的人才大失血 Meta收购Manus的背后:AI时代的危与机 AI芯片今年预计增长6倍!百度计划分拆昆仑芯赴港上市 Mac Pro更新计划停摆 项目被Mac Studio取代 DeepSeek梁文峰发表新论文 海斯坦普集团巩固在华发展布局,过去四年营收增长 80% 百公里加速不小于5秒,“加速内卷”即将终结? 全国产化标杆!移远通信5G车载模组AR59xUA系列斩获多家头部车企定点 比亚迪唐L广州车展上市:21.48万起带 “车位到车位” 智驾 北京越野全新SUV概念车亮相,外观很硬朗,敞篷,2+2座椅布局 20-30万选SUV不纠结!这国产双车直击痛点:大空间好开还实用 同星智能荣获金辑奖!TSMaster软件破局,重塑汽车电子工具链 智能化“竞速赛”,供应链创新驶入“快车道”|2025金辑奖中国汽车新供应链百强榜 丰田9月全球产量增长11% 电动车需求下降,Rivian将裁员逾600人 加拿大削减通用和Stellantis的汽车免税进口配额 iPhone面容解锁不需要摄像头:网友实测遮住前摄也能解锁 小鹏新总部“航站楼”汇天全新展厅首次公开,陆空一体飞行汽车等集体亮相