阿里達摩院上線“文本生成視頻大模型”，目前只支持英文輸入

發(fā)布時間：5w

界面Vnews

財經(jīng)熱點，現(xiàn)場呈現(xiàn) 聚焦財經(jīng)商業(yè)領(lǐng)域視頻報道

00:30

00:35

00:28

00:38

更多視頻

編導(dǎo)：謝希文編輯：龍雪晴、孫曉旭

近日，阿里達摩院已在AI模型社區(qū)“魔搭”ModelScope上線了“文本生成視頻大模型”。據(jù)介紹，整體模型參數(shù)約17億，目前只支持英文輸入。擴散模型采用Unet3D結(jié)構(gòu)，通過從純高斯噪聲視頻中，迭代去噪的過程，實現(xiàn)視頻生成的功能。