阿里達摩院上線“文本生成視頻大模型”,目前只支持英文輸入

發(fā)布時間:5w

界面Vnews

財經(jīng)熱點,現(xiàn)場呈現(xiàn) 聚焦財經(jīng)商業(yè)領(lǐng)域視頻報道

更多

編導(dǎo):謝希文   編輯:龍雪晴 、孫曉旭    

近日,阿里達摩院已在AI模型社區(qū)“魔搭”ModelScope上線了“文本生成視頻大模型”。據(jù)介紹,整體模型參數(shù)約17億,目前只支持英文輸入。擴散模型采用Unet3D結(jié)構(gòu),通過從純高斯噪聲視頻中,迭代去噪的過程,實現(xiàn)視頻生成的功能。

精彩回顧

評論

暫無評論哦,快來評價一下吧!