标签:时序外推

谷歌推出多模态视频模型,自动生成丰富动作视频

VLOGGER模型概述:VLOGGER是谷歌研究人员推出的一款多模态扩散模型,能够根据用户输入的图像和语音生成带语音和丰富动作的人物视频。该模型结合了文本生成图...