首页 > 汽车早报 > 汽车早报 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

汽车早报更多>>

吉利汽车发布2024年ESG报告 荣获多项榜单第一 iCAR汽车发布全场景改装生态 让个性“合法生长” 荣威全面焕新 AI赋能重塑国民汽车品牌 逍遥超级融合架构之上,别克“全华班”力推至境,能否后来居上? 奇瑞星途火力全开,多款新车亮相上海车展,今年销量要“翻番”了 风行星海上海车展展望:年内冲击9万辆,欧洲市场成海外拓展重点 奇瑞集团旗下品牌携53款车型亮相上海车展 展示海陆空代表性技术展品 五年 把新能源车“变量”化为催化剂订单“增量” 亿纬锂能上海车展秀实力,大圆柱电池技术如何引领新能源未来? 2025年皖南医学院第二附属医院高层次人才招聘公告 2025年吉安市市直三家公立医院编外工作人员招聘公告 2025年九江市瑞昌市招聘“多员合一”社区工作者公告 2025年赣州市市直医疗卫生单位及赣州市立医院招聘专业技术人员公告 2024年车企立的flag 完成了几个? 至臻交付,自豪之选 问界M9第15万辆用户交付仪式成功举办 有颜也有料 四款纯电中型车推荐 2025年1月-3月,要上市的十款新车 卷疯了,奥迪A4L直降15万,17万就能入手? 乘龙M3极限自卸车荣获值得用户信赖奖项 宝骏电动车主集体遭遇刹车惊魂,软件BUG越来越可怕 纯电续航500km起 新能源C级轿车选启源A07还是星海S7? 大量官图被提前泄漏!领克大型SUV今晚发布,真不是国产“揽胜”? 拔得头筹!问界M9、问界M7分获净推荐值冠季军 敢超越 方显凌云之志 浅析星途凌云征服37°1雪如意超级陡坡 财务体系重组,削减4S店数量,不打价格战的林肯也扛不住了? 比亚迪汉L的信息与猜想:预计和腾势Z9同平台,有望搭载三电机? 抄底正当时,最低不到12万元,这些合资SUV太卷了 感谢米粉支持!小米汽车1年交付量超13万辆 年轻人心中的理想旅行车 从这台沃尔沃V60身上你会找到答案 星纪元ET增程四驱广州上市,试驾体验与豪华科技能否征服市场?