智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量

AI最新资讯1个月前发布 tree
15 0 0

今日应用


今日话题


智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
 

重点标签 视频生成智谱AI清影多模态技术突破

文章摘要


智谱AI发布了一款名为「清影」的视频生成大模型,它能够根据用户创意生成高精度视频。用户只需提供几个字到几百个字的创意和30秒的等待时间,即可获得1440×960清晰度的视频。清影已上线清言App,用户可以在网页端、App或AI动态照片小程序中体验其功能。目前,清影生成的视频时长为6秒,所有用户均可免费使用。

智谱AI表示,随着技术的进步,清影的生成能力将扩展至短视频制作、广告生成和电影剪辑等领域。在研发过程中,Scaling Law在算法和数据方面发挥了重要作用。智谱AI CEO张鹏强调,随着算法和数据的迭代,Scaling Law将继续发挥其影响力。

清影在风景、动物、科幻、人文历史等类型的视频内容上表现良好,擅长生成卡通风格、真实摄影风格和二次元动漫风格等视频。在实体类型呈现效果上,动物的表现优于植物、物品、建筑和人物。清影支持文生视频和图生视频,能够生成奇幻动画风格的内容。

用户可以通过提供提示词或上传图片来生成视频。例如,用户可以描述一个场景或动作,清影会根据这些信息生成相应的视频。此外,清影还可以将静态图片转化为动态视频,为用户带来新的创作玩法。

智谱AI的清影基于自研的新一代视频生成大模型CogVideoX,该模型融合了文本、时间和空间三个维度。CogVideoX采用了Sora算法设计,通过优化,推理速度比前代模型提升了6倍。智谱AI还自研了高效的三维变分自编码器结构(3D VAE),大幅降低了模型训练成本和难度。

为了解决视频数据缺乏描述性文本的问题,智谱AI自研了端到端的视频理解模型,为视频数据生成详细且贴合内容的描述。此外,智谱AI还研发了一种将文本、时间和空间融合的transformer架构,通过expert adaptive layernorm对文本和视频特征空间进行处理,提高了模型的指令遵循度。

随着清影的上线,视频生成领域迎来了智谱AI这一重量级玩家。清影API也已上线大模型开放平台bigmodel.cn,企业和开发者可以通过API调用体验和使用文生视频和图生视频的模型能力。如今,无论是没有视频制作基础的人还是专业内容创作者,都能借助大模型实现视频创作。同时,「真格星球AI+创业营」为创业者提供了与大咖导师和同道创业者交流的平台,助力AI灵感碰撞和商机寻找。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...