杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!

AI最新资讯3个月前发布 tree
48 0 0

今日应用


今日话题


杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!
杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!
 

重点标签 AI技术视频生成语音技术音频生成AI应用

文章摘要


AI技术领域近期动态摘要:

近期,AI技术领域出现了多项激动人心的进展。首先是Luma的Gen-3 Alpha版本发布,其高保真和一致性给人们带来了震撼。紧接着,Google DeepMind低调发布了其视频生成语音(V2A)技术的最新进展。虽然这项技术尚未对公众开放,但通过官方发布的视频Demo,我们可以看到其出色的效果。DeepMind强调所有示例都是由V2A技术和其最先进的生成视频模型Veo共同完成的。

V2A技术能够结合视频像素和自然语言文本提示,为屏幕上的动作生成丰富的配音。这项技术的应用前景非常广泛,不仅可以与Veo等视频生成模型结合,创造出具有戏剧性配乐和逼真音效的视频,还能为档案材料和无声电影等传统影像生成音轨,极大地拓宽了创作的可能。

在技术实现上,V2A系统首先将视频输入编码成压缩表示,然后通过扩散模型从随机噪声中迭代细化音频,生成与提示紧密对齐的同步、逼真音频。此外,为了生成更高质量的音频,研究团队在训练过程中添加了包括AI生成的注释在内的更多信息。

Google DeepMind在开发这项技术时,特别强调了负责任的态度,承诺在向公众开放之前,V2A技术将经过严格的安全评估和测试。同时,他们还整合了SynthID工具包到V2A研究中,为所有AI生成的内容添加水印,以防止技术的滥用。

此外,6月19日,《AIGC体验派》直播节目邀请了CMO Club创始人班丽婵和火山引擎AI解决方案负责人骆怡航,共同探讨AIGC在营销领域的应用及其对营销增长的促进作用。讨论的主题包括AIGC是否已经为营销人带来实际价值,AIGC在营销领域的具体应用,以及营销人员如何衡量AIGC的成效。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...