阿里圖生視頻AI模型EMO亮相,蒙娜麗莎發(fā)聲,赫本驚艷獻(xiàn)唱

發(fā)布時(shí)間:5.2w

界面Vnews

財(cái)經(jīng)熱點(diǎn),現(xiàn)場呈現(xiàn) 聚焦財(cái)經(jīng)商業(yè)領(lǐng)域視頻報(bào)道

更多

編導(dǎo):宋美辰   編輯:劉春 、江旭波    

日前,阿里巴巴集團(tuán)智能計(jì)算研究院上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動(dòng)的肖像視頻生成框架”。據(jù)悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時(shí)可以根據(jù)輸入視頻的長度生成任何持續(xù)時(shí)間的視頻。

精彩回顧

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!