正在閱讀:

零成本一鍵開(kāi)播,數(shù)字人迎來(lái)應(yīng)用爆發(fā)

掃一掃下載界面新聞APP

零成本一鍵開(kāi)播,數(shù)字人迎來(lái)應(yīng)用爆發(fā)

媲美并超越真人。

文 | Tech星球 王琳

24小時(shí)不眠不休,季度GMV超過(guò)50萬(wàn),拉動(dòng)訂單量增長(zhǎng)超10倍——這不是科幻片,而是百度優(yōu)選主播東北翠花的真實(shí)戰(zhàn)績(jī)。更重要的是,翠花并沒(méi)有額外投入更多的成本,反而使得直播成本大幅度降低。

這其中百度慧播星數(shù)字人起了關(guān)鍵作用——只需要上傳一段3分鐘左右的視頻,最快3小時(shí),便可以生成自己的數(shù)字人直播間。更重要的是,這種“高說(shuō)服力”數(shù)字人,其聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活,實(shí)現(xiàn)了數(shù)字人超越真人的體驗(yàn)。

過(guò)去,一個(gè)數(shù)字人的制造成本從幾萬(wàn)到幾百萬(wàn)不等,因?yàn)槌杀据^高,關(guān)于大模型應(yīng)用如何落地的爭(zhēng)論從未停止。但現(xiàn)在,模型能力的進(jìn)步讓數(shù)字人的成本下降到了百元、千元級(jí)別甚至免費(fèi),周期也指數(shù)級(jí)縮短,效果也更好。

技術(shù)的大規(guī)模下降正在重構(gòu)產(chǎn)業(yè)認(rèn)知。4月25日,百度創(chuàng)始人李彥宏在Create大會(huì)表示,AI數(shù)字人是2025年最令人激動(dòng)的突破性應(yīng)用之一。因?yàn)?,任何一個(gè)時(shí)代,創(chuàng)新的本質(zhì)都來(lái)源于技術(shù)平權(quán)。而當(dāng)AI生產(chǎn)力成本趨近于零,任何個(gè)體都能擁有自己的數(shù)字分身,數(shù)字人進(jìn)入千行百業(yè),注定引爆百萬(wàn)級(jí)應(yīng)用場(chǎng)景的革命。

零成本開(kāi)播,人人可享的數(shù)字人

號(hào)稱業(yè)界首個(gè)AI全棧式數(shù)字人解決方案的慧播星最近上線了一個(gè)新功能:一鍵開(kāi)播,在官方的介紹里,僅憑一部手機(jī),只需要上傳一段2分鐘的真人出鏡視頻,最短3個(gè)小時(shí),普通人就可以完成數(shù)字人開(kāi)播。

按照官方的指引,我們打開(kāi)了百度APP,搜索“慧播星”,點(diǎn)擊“手機(jī)端一鍵開(kāi)播”、“創(chuàng)建數(shù)字人”變來(lái)到了產(chǎn)品首頁(yè),如下圖。

Tech星球首先錄制了一段3分20秒的視頻,我們并沒(méi)有準(zhǔn)備諸如打光燈、手機(jī)支架類的任何設(shè)備,只是用了一部手機(jī),在視頻的錄制過(guò)程中,全程露臉。之后,在等待視頻上傳的同時(shí),我們就可以選擇自己的人設(shè)和主題、以及直播腳本。

慧播星準(zhǔn)備了4個(gè)人設(shè),包含情感咨詢、讀書分享、健康咨詢、國(guó)學(xué)風(fēng)水,比如,隨機(jī)選擇讀書分享,AI就自動(dòng)幫我們生成了一份人設(shè)指南以及直播主題,甚至連直播腳本都寫好了。如果有需要,你還可以自由設(shè)定自己的專屬人設(shè)。

為了測(cè)試慧播星的真實(shí)水平,我們并沒(méi)有選擇這些預(yù)備好的人設(shè),而是決定自定義,畢竟隨機(jī)出題,更能體現(xiàn)AI的能力。我們給自己定義的人設(shè)是,塑身愛(ài)好者,尤其擅長(zhǎng)解決辦公室久坐造成的各種體態(tài)、體型問(wèn)題。

至于直播腳本,我們選擇用“AI幫我寫”,整個(gè)腳本生成過(guò)程不到2分鐘,但卻針對(duì)辦公室常見(jiàn)的烏龜頸、扁平臀、大腿粗都有涉及,并給出了解決方案。

這樣一套流程操作下來(lái),就可以靜靜等待專屬數(shù)字人分身開(kāi)播了。在整個(gè)直播制作過(guò)程中,無(wú)須全程緊盯,制作好會(huì)短信通知,頁(yè)面也會(huì)提示一個(gè)大概的開(kāi)播時(shí)間。

市面的數(shù)字人神情呆板、動(dòng)作木訥、機(jī)器音重的并不在少數(shù),因此我們對(duì)慧播星的期待值并沒(méi)有很高。但3小時(shí)43分鐘后,我們的數(shù)字人直播間制作完成,它的表現(xiàn)大大超出了我們的預(yù)期。

首先,慧播星數(shù)字人的表情、語(yǔ)氣、動(dòng)作都非常真實(shí),嘴唇弧度完全接近真人、甚至發(fā)型的輪廓清晰到可以看到額前飄過(guò)的幾根碎發(fā)。在直播過(guò)程中,隨著身體的晃動(dòng),頭發(fā)也會(huì)隨之自然擺動(dòng)。

市面上很多數(shù)字人在做動(dòng)作時(shí),往往不符合人類邏輯。比如直播過(guò)程中眼鏡下滑,很多數(shù)字人并繞一大圈去扶眼鏡,而是慧播星可以像人類一樣,直接找到鏡腿,過(guò)程中動(dòng)作絲毫不僵硬。再比如很多主播去撥頭發(fā)時(shí),一些數(shù)字人會(huì)在頭發(fā)附近隨便繞一圈,但慧播星生成的數(shù)字人手指會(huì)沿著鬢角,全程觸摸到頭發(fā),按照一定的弧度完成撥頭發(fā)的動(dòng)作,非常符合人類行為邏輯。

圖注:左側(cè)為真人,右側(cè)為數(shù)字人。

不同于傳統(tǒng)數(shù)字人全程語(yǔ)氣毫無(wú)變化的念腳本,在直播時(shí),慧播星數(shù)字人能夠根據(jù)腳本內(nèi)容的含義和語(yǔ)境,自動(dòng)調(diào)整說(shuō)話的語(yǔ)氣和強(qiáng)調(diào)。同時(shí),數(shù)字人的面部表情和口唇也會(huì)做出相應(yīng)變化,符合觀眾的感知經(jīng)驗(yàn)。比如當(dāng)說(shuō)到“娓娓道來(lái)”幾個(gè)字時(shí),真人主播嘴唇會(huì)輕微翹起,且稍微皺一下眉頭,而數(shù)字人主播也會(huì)出現(xiàn)這種完全符合真人行為的微表情變化。

慧播星生成的數(shù)字人不僅僅是像真人,它的直播間的互動(dòng)表現(xiàn)甚至比真人還要好。在直播過(guò)程中,有觀眾進(jìn)來(lái)提問(wèn),數(shù)字人會(huì)自然地打招呼,并一種充滿熱情地語(yǔ)調(diào)表示“歡迎XX來(lái)到直播間”。更重要的是,它會(huì)及時(shí)回答問(wèn)題,而且互動(dòng)有趣。比如,有觀眾問(wèn),如何讓大腿根變瘦。主播會(huì)表示自己曾經(jīng)也有這樣的困擾,回答完后,還會(huì)提醒觀眾繼續(xù)提問(wèn)。

這樣一套流程下來(lái),即便你從未有過(guò)直播經(jīng)驗(yàn),沒(méi)有動(dòng)輒上萬(wàn)的專業(yè)設(shè)備,完全可以在不花一分錢的情況下,開(kāi)啟自己的直播首秀,并且它的效果完全不亞于,甚至超越真人。對(duì)于中小企業(yè)而言,慧播星讓他們徹底甩開(kāi)了成本負(fù)擔(dān),可以放開(kāi)手腳去探索更多業(yè)務(wù)。

慧播星的出現(xiàn),讓數(shù)字人不再是實(shí)驗(yàn)室里高高在上的技術(shù),企業(yè)發(fā)布會(huì)的空頭支票,而是切切實(shí)實(shí)讓技術(shù)普惠到每一個(gè)普通人,數(shù)字人也真正迎來(lái)了屬于自己的DeepSeek時(shí)刻。

技術(shù)平權(quán)背后,大模型讓數(shù)字人“降本增效”

在大模型出現(xiàn)以前,數(shù)字人技術(shù)經(jīng)歷了從建模、綁定、渲染到語(yǔ)音交互、自然語(yǔ)音處理、視覺(jué)技術(shù)等多次迭代,但他們都未能大規(guī)模降低數(shù)字人的成本和周期。制作一個(gè)數(shù)字人往往需要幾萬(wàn)元甚至數(shù)百萬(wàn)元,周期以月為單位,并且效果欠佳。

大模型技術(shù)的進(jìn)步徹底改變了這一敘事。以百度慧播星為例子,其數(shù)字人的成本已經(jīng)是去年的三分之一,并且效果更好。

數(shù)字人主播得以更專業(yè)的前提之一,便是以DeepSeek R1、文心4.5、X1等大語(yǔ)言模型的能力大幅度提高,這讓數(shù)字人的腳本能力得以大幅度提升?,F(xiàn)在,AI完全可以根據(jù)直播間的人設(shè)來(lái)完成不同風(fēng)格的腳本,比如一個(gè)醫(yī)生需要專業(yè)且謹(jǐn)慎,一個(gè)電商主播可以引經(jīng)據(jù)典介紹商品。

這很大程度上解決了,真人主播受限于文化水平、語(yǔ)言表達(dá)能力,直播講解商品時(shí)參差不齊的情況。

但這還不足以讓數(shù)字人超越真人主播,畢竟真人直播間最重要的是,主播的語(yǔ)氣、動(dòng)作、臨場(chǎng)反應(yīng),這也是實(shí)現(xiàn)高說(shuō)服力的關(guān)鍵突破點(diǎn)。

此次慧播星數(shù)字人非常重要的一次迭代便是由腳本模式升級(jí)為劇本模式。在該模式下,數(shù)字人主播可以根據(jù)劇本內(nèi)容實(shí)時(shí)調(diào)整語(yǔ)調(diào)、表情和動(dòng)作,比如講解《鋼鐵是怎么煉成的》可以激情澎湃,講到關(guān)鍵情節(jié)時(shí),可以“揮舞拳頭”表達(dá)主人公的情緒;講《我的阿勒泰》可以像作者一樣娓娓道來(lái),這些不同的情感,都可以通過(guò)劇本模式,根據(jù)語(yǔ)言情境生成,并且可以做到情緒轉(zhuǎn)折、動(dòng)作切換順暢。

這還不夠。一個(gè)真實(shí)的直播間,除了主播,往往還有助播、場(chǎng)控、運(yùn)營(yíng)等角色打配合。為此,慧播星給數(shù)字人配備了一個(gè)可以自主決策的AI大腦,它可以像人一樣具備感知和決策的能力。

在現(xiàn)實(shí)的直播情境下,直播間內(nèi)往往會(huì)出現(xiàn)多個(gè)用戶對(duì)同一個(gè)商品感興趣,要求主播快點(diǎn)講解的情況。數(shù)字人收到信號(hào)后,就會(huì)調(diào)度視頻來(lái)呈現(xiàn)用戶想要看到的商品講解畫面,跟用戶實(shí)時(shí)互動(dòng)講解商品。

當(dāng)講解完后,數(shù)字人發(fā)現(xiàn)用戶的購(gòu)買熱情很高,便會(huì)調(diào)動(dòng)營(yíng)銷專家來(lái)發(fā)紅包,給出一定的優(yōu)惠政策,同時(shí)調(diào)動(dòng)助播專家調(diào)節(jié)氣氛,以此完成商品的最大轉(zhuǎn)化。這里的每個(gè)專家都不是真人,它們是一個(gè)一個(gè)Agent,只需要一個(gè)調(diào)度,直播間便可以實(shí)現(xiàn)多個(gè)Agent的協(xié)同,實(shí)現(xiàn)毫秒級(jí)的響應(yīng)。從這個(gè)角度講,一個(gè)數(shù)字人可以同時(shí)干至少3個(gè)人的活,其直播水平已經(jīng)超越了真人直播間。

在此前今年3月,百度就曾面向商家客戶推出了“一鍵克隆”功能,只需上傳一段直播回放錄屏或一段真人出鏡短視頻,即可生成與真人無(wú)異的數(shù)字人分身,聲音形象和直播間裝修都可以準(zhǔn)備好,實(shí)現(xiàn)了開(kāi)播零門檻。

更重要的是,憑借自研多模態(tài)算法,慧播星攻克了360度大角度側(cè)轉(zhuǎn)、遮擋以及手持等數(shù)行業(yè)難題,借此服飾主播可以手持商品,通過(guò)大角度側(cè)轉(zhuǎn)、大幅度動(dòng)作,讓觀眾看清每一個(gè)細(xì)節(jié),提高轉(zhuǎn)化率。

百度慧播星數(shù)字人的表現(xiàn)也獲得了IDC的高度評(píng)價(jià)。近期發(fā)布的《中國(guó)AI Agent之電商直播數(shù)字人實(shí)測(cè),2Q25》報(bào)告顯示,百度慧播星綜合實(shí)力排名行業(yè)第一,五項(xiàng)測(cè)評(píng)指標(biāo)中,百度慧播星在技術(shù)能力、產(chǎn)品表現(xiàn)、平臺(tái)合規(guī)與穩(wěn)定性、客戶服務(wù)四項(xiàng)均位列第一。

這一套組合拳下來(lái),過(guò)去一年,慧播星數(shù)字人主播數(shù)量累計(jì)超過(guò)10 萬(wàn),其展現(xiàn)出來(lái)的高說(shuō)服力也帶來(lái)了顯著的收益,大盤來(lái)看數(shù)字人直播轉(zhuǎn)化率提升了31%,降低了80%的開(kāi)播成本。

當(dāng)數(shù)字人開(kāi)始接管商業(yè)世界

今年4月,李彥宏在百度25周年的全員信中明確指出,大模型賦能的AI原生應(yīng)用將在2025年繼續(xù)井噴式增長(zhǎng)。

在Tech星球看來(lái),AI原生應(yīng)用爆發(fā)的前提需要滿足三個(gè)條件:落地成本大幅下降、產(chǎn)品能力和效果顯著提升,且場(chǎng)景多元。4月25日,Create2025百度AI開(kāi)發(fā)者大會(huì)的高說(shuō)服力數(shù)字人恰好完全滿足,其實(shí)績(jī)也非常抗打。

今年春節(jié)期間,數(shù)字人讓主播們放了個(gè)好假,但同時(shí)商家卻并沒(méi)有因此業(yè)績(jī)下滑。據(jù)Tech星球不完全統(tǒng)計(jì),今年百度優(yōu)選年貨節(jié)期間,蘇寧易購(gòu)超級(jí)買有10場(chǎng)直播,其中5場(chǎng)直播超過(guò)18個(gè)小時(shí),有些甚至達(dá)到了24小時(shí),這些直播里,幾乎全部由數(shù)字人主導(dǎo),他們貢獻(xiàn)了遠(yuǎn)超真人直播的業(yè)績(jī),數(shù)據(jù)顯示年貨節(jié)期間,該直播間GMV突破了300萬(wàn),訂單量同比提升了50倍。

銷售額大幅提升的同時(shí),企業(yè)并沒(méi)有額外支出更多成本,甚至因?yàn)橛昧藬?shù)字人,成本還下降了。企業(yè)對(duì)數(shù)字人的態(tài)度也從此前的觀望逐漸轉(zhuǎn)向擁抱,他們有了底氣探索更多的賽道,公司的天花板也更高了。

數(shù)字人也正在從電商場(chǎng)景拓展開(kāi)來(lái)。在百度上,用戶可以看到主攻孩子抑郁、厭學(xué)等情緒的觀心實(shí)驗(yàn)室;提供旅游服務(wù)的輕松游旅行等都在使用數(shù)字人直播。未來(lái)景區(qū)里既可以講解歷史,又能直播帶貨的數(shù)字人AI導(dǎo)游;孤獨(dú)經(jīng)濟(jì)下的AI陪伴直播等等,數(shù)字人未來(lái)完全有可能滲透到人類生活中的方方面面。

這并非個(gè)例,而是技術(shù)發(fā)展的必然。a16z 發(fā)布 AI Avatar 數(shù)字人的最新報(bào)告,報(bào)告預(yù)測(cè):現(xiàn)在底層模型的技術(shù)水平已經(jīng)顯著提升,能夠生成質(zhì)量較高、觀看體驗(yàn)較好的 AI 虛擬形象,因此可以肯定地說(shuō),應(yīng)用層面將迎來(lái)快速發(fā)展的機(jī)遇,預(yù)計(jì)該領(lǐng)域?qū)⒃杏龆鄠€(gè)價(jià)值數(shù)十億美元的公司。

現(xiàn)在來(lái)看,數(shù)字人應(yīng)用的爆發(fā)已跨越技術(shù)驗(yàn)證期,正邁入規(guī)模化落地的新臨界點(diǎn)。2025年,數(shù)字人將像水電一樣滲透生活,極低的成本和不輸真人的效果很有可能讓它成為企業(yè)嘗試擁抱大模型和應(yīng)用大模型最好的入口之一。這不是未來(lái),而是正在發(fā)生的現(xiàn)實(shí)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

零成本一鍵開(kāi)播,數(shù)字人迎來(lái)應(yīng)用爆發(fā)

媲美并超越真人。

文 | Tech星球 王琳

24小時(shí)不眠不休,季度GMV超過(guò)50萬(wàn),拉動(dòng)訂單量增長(zhǎng)超10倍——這不是科幻片,而是百度優(yōu)選主播東北翠花的真實(shí)戰(zhàn)績(jī)。更重要的是,翠花并沒(méi)有額外投入更多的成本,反而使得直播成本大幅度降低。

這其中百度慧播星數(shù)字人起了關(guān)鍵作用——只需要上傳一段3分鐘左右的視頻,最快3小時(shí),便可以生成自己的數(shù)字人直播間。更重要的是,這種“高說(shuō)服力”數(shù)字人,其聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活,實(shí)現(xiàn)了數(shù)字人超越真人的體驗(yàn)。

過(guò)去,一個(gè)數(shù)字人的制造成本從幾萬(wàn)到幾百萬(wàn)不等,因?yàn)槌杀据^高,關(guān)于大模型應(yīng)用如何落地的爭(zhēng)論從未停止。但現(xiàn)在,模型能力的進(jìn)步讓數(shù)字人的成本下降到了百元、千元級(jí)別甚至免費(fèi),周期也指數(shù)級(jí)縮短,效果也更好。

技術(shù)的大規(guī)模下降正在重構(gòu)產(chǎn)業(yè)認(rèn)知。4月25日,百度創(chuàng)始人李彥宏在Create大會(huì)表示,AI數(shù)字人是2025年最令人激動(dòng)的突破性應(yīng)用之一。因?yàn)?,任何一個(gè)時(shí)代,創(chuàng)新的本質(zhì)都來(lái)源于技術(shù)平權(quán)。而當(dāng)AI生產(chǎn)力成本趨近于零,任何個(gè)體都能擁有自己的數(shù)字分身,數(shù)字人進(jìn)入千行百業(yè),注定引爆百萬(wàn)級(jí)應(yīng)用場(chǎng)景的革命。

零成本開(kāi)播,人人可享的數(shù)字人

號(hào)稱業(yè)界首個(gè)AI全棧式數(shù)字人解決方案的慧播星最近上線了一個(gè)新功能:一鍵開(kāi)播,在官方的介紹里,僅憑一部手機(jī),只需要上傳一段2分鐘的真人出鏡視頻,最短3個(gè)小時(shí),普通人就可以完成數(shù)字人開(kāi)播。

按照官方的指引,我們打開(kāi)了百度APP,搜索“慧播星”,點(diǎn)擊“手機(jī)端一鍵開(kāi)播”、“創(chuàng)建數(shù)字人”變來(lái)到了產(chǎn)品首頁(yè),如下圖。

Tech星球首先錄制了一段3分20秒的視頻,我們并沒(méi)有準(zhǔn)備諸如打光燈、手機(jī)支架類的任何設(shè)備,只是用了一部手機(jī),在視頻的錄制過(guò)程中,全程露臉。之后,在等待視頻上傳的同時(shí),我們就可以選擇自己的人設(shè)和主題、以及直播腳本。

慧播星準(zhǔn)備了4個(gè)人設(shè),包含情感咨詢、讀書分享、健康咨詢、國(guó)學(xué)風(fēng)水,比如,隨機(jī)選擇讀書分享,AI就自動(dòng)幫我們生成了一份人設(shè)指南以及直播主題,甚至連直播腳本都寫好了。如果有需要,你還可以自由設(shè)定自己的專屬人設(shè)。

為了測(cè)試慧播星的真實(shí)水平,我們并沒(méi)有選擇這些預(yù)備好的人設(shè),而是決定自定義,畢竟隨機(jī)出題,更能體現(xiàn)AI的能力。我們給自己定義的人設(shè)是,塑身愛(ài)好者,尤其擅長(zhǎng)解決辦公室久坐造成的各種體態(tài)、體型問(wèn)題。

至于直播腳本,我們選擇用“AI幫我寫”,整個(gè)腳本生成過(guò)程不到2分鐘,但卻針對(duì)辦公室常見(jiàn)的烏龜頸、扁平臀、大腿粗都有涉及,并給出了解決方案。

這樣一套流程操作下來(lái),就可以靜靜等待專屬數(shù)字人分身開(kāi)播了。在整個(gè)直播制作過(guò)程中,無(wú)須全程緊盯,制作好會(huì)短信通知,頁(yè)面也會(huì)提示一個(gè)大概的開(kāi)播時(shí)間。

市面的數(shù)字人神情呆板、動(dòng)作木訥、機(jī)器音重的并不在少數(shù),因此我們對(duì)慧播星的期待值并沒(méi)有很高。但3小時(shí)43分鐘后,我們的數(shù)字人直播間制作完成,它的表現(xiàn)大大超出了我們的預(yù)期。

首先,慧播星數(shù)字人的表情、語(yǔ)氣、動(dòng)作都非常真實(shí),嘴唇弧度完全接近真人、甚至發(fā)型的輪廓清晰到可以看到額前飄過(guò)的幾根碎發(fā)。在直播過(guò)程中,隨著身體的晃動(dòng),頭發(fā)也會(huì)隨之自然擺動(dòng)。

市面上很多數(shù)字人在做動(dòng)作時(shí),往往不符合人類邏輯。比如直播過(guò)程中眼鏡下滑,很多數(shù)字人并繞一大圈去扶眼鏡,而是慧播星可以像人類一樣,直接找到鏡腿,過(guò)程中動(dòng)作絲毫不僵硬。再比如很多主播去撥頭發(fā)時(shí),一些數(shù)字人會(huì)在頭發(fā)附近隨便繞一圈,但慧播星生成的數(shù)字人手指會(huì)沿著鬢角,全程觸摸到頭發(fā),按照一定的弧度完成撥頭發(fā)的動(dòng)作,非常符合人類行為邏輯。

圖注:左側(cè)為真人,右側(cè)為數(shù)字人。

不同于傳統(tǒng)數(shù)字人全程語(yǔ)氣毫無(wú)變化的念腳本,在直播時(shí),慧播星數(shù)字人能夠根據(jù)腳本內(nèi)容的含義和語(yǔ)境,自動(dòng)調(diào)整說(shuō)話的語(yǔ)氣和強(qiáng)調(diào)。同時(shí),數(shù)字人的面部表情和口唇也會(huì)做出相應(yīng)變化,符合觀眾的感知經(jīng)驗(yàn)。比如當(dāng)說(shuō)到“娓娓道來(lái)”幾個(gè)字時(shí),真人主播嘴唇會(huì)輕微翹起,且稍微皺一下眉頭,而數(shù)字人主播也會(huì)出現(xiàn)這種完全符合真人行為的微表情變化。

慧播星生成的數(shù)字人不僅僅是像真人,它的直播間的互動(dòng)表現(xiàn)甚至比真人還要好。在直播過(guò)程中,有觀眾進(jìn)來(lái)提問(wèn),數(shù)字人會(huì)自然地打招呼,并一種充滿熱情地語(yǔ)調(diào)表示“歡迎XX來(lái)到直播間”。更重要的是,它會(huì)及時(shí)回答問(wèn)題,而且互動(dòng)有趣。比如,有觀眾問(wèn),如何讓大腿根變瘦。主播會(huì)表示自己曾經(jīng)也有這樣的困擾,回答完后,還會(huì)提醒觀眾繼續(xù)提問(wèn)。

這樣一套流程下來(lái),即便你從未有過(guò)直播經(jīng)驗(yàn),沒(méi)有動(dòng)輒上萬(wàn)的專業(yè)設(shè)備,完全可以在不花一分錢的情況下,開(kāi)啟自己的直播首秀,并且它的效果完全不亞于,甚至超越真人。對(duì)于中小企業(yè)而言,慧播星讓他們徹底甩開(kāi)了成本負(fù)擔(dān),可以放開(kāi)手腳去探索更多業(yè)務(wù)。

慧播星的出現(xiàn),讓數(shù)字人不再是實(shí)驗(yàn)室里高高在上的技術(shù),企業(yè)發(fā)布會(huì)的空頭支票,而是切切實(shí)實(shí)讓技術(shù)普惠到每一個(gè)普通人,數(shù)字人也真正迎來(lái)了屬于自己的DeepSeek時(shí)刻。

技術(shù)平權(quán)背后,大模型讓數(shù)字人“降本增效”

在大模型出現(xiàn)以前,數(shù)字人技術(shù)經(jīng)歷了從建模、綁定、渲染到語(yǔ)音交互、自然語(yǔ)音處理、視覺(jué)技術(shù)等多次迭代,但他們都未能大規(guī)模降低數(shù)字人的成本和周期。制作一個(gè)數(shù)字人往往需要幾萬(wàn)元甚至數(shù)百萬(wàn)元,周期以月為單位,并且效果欠佳。

大模型技術(shù)的進(jìn)步徹底改變了這一敘事。以百度慧播星為例子,其數(shù)字人的成本已經(jīng)是去年的三分之一,并且效果更好。

數(shù)字人主播得以更專業(yè)的前提之一,便是以DeepSeek R1、文心4.5、X1等大語(yǔ)言模型的能力大幅度提高,這讓數(shù)字人的腳本能力得以大幅度提升?,F(xiàn)在,AI完全可以根據(jù)直播間的人設(shè)來(lái)完成不同風(fēng)格的腳本,比如一個(gè)醫(yī)生需要專業(yè)且謹(jǐn)慎,一個(gè)電商主播可以引經(jīng)據(jù)典介紹商品。

這很大程度上解決了,真人主播受限于文化水平、語(yǔ)言表達(dá)能力,直播講解商品時(shí)參差不齊的情況。

但這還不足以讓數(shù)字人超越真人主播,畢竟真人直播間最重要的是,主播的語(yǔ)氣、動(dòng)作、臨場(chǎng)反應(yīng),這也是實(shí)現(xiàn)高說(shuō)服力的關(guān)鍵突破點(diǎn)。

此次慧播星數(shù)字人非常重要的一次迭代便是由腳本模式升級(jí)為劇本模式。在該模式下,數(shù)字人主播可以根據(jù)劇本內(nèi)容實(shí)時(shí)調(diào)整語(yǔ)調(diào)、表情和動(dòng)作,比如講解《鋼鐵是怎么煉成的》可以激情澎湃,講到關(guān)鍵情節(jié)時(shí),可以“揮舞拳頭”表達(dá)主人公的情緒;講《我的阿勒泰》可以像作者一樣娓娓道來(lái),這些不同的情感,都可以通過(guò)劇本模式,根據(jù)語(yǔ)言情境生成,并且可以做到情緒轉(zhuǎn)折、動(dòng)作切換順暢。

這還不夠。一個(gè)真實(shí)的直播間,除了主播,往往還有助播、場(chǎng)控、運(yùn)營(yíng)等角色打配合。為此,慧播星給數(shù)字人配備了一個(gè)可以自主決策的AI大腦,它可以像人一樣具備感知和決策的能力。

在現(xiàn)實(shí)的直播情境下,直播間內(nèi)往往會(huì)出現(xiàn)多個(gè)用戶對(duì)同一個(gè)商品感興趣,要求主播快點(diǎn)講解的情況。數(shù)字人收到信號(hào)后,就會(huì)調(diào)度視頻來(lái)呈現(xiàn)用戶想要看到的商品講解畫面,跟用戶實(shí)時(shí)互動(dòng)講解商品。

當(dāng)講解完后,數(shù)字人發(fā)現(xiàn)用戶的購(gòu)買熱情很高,便會(huì)調(diào)動(dòng)營(yíng)銷專家來(lái)發(fā)紅包,給出一定的優(yōu)惠政策,同時(shí)調(diào)動(dòng)助播專家調(diào)節(jié)氣氛,以此完成商品的最大轉(zhuǎn)化。這里的每個(gè)專家都不是真人,它們是一個(gè)一個(gè)Agent,只需要一個(gè)調(diào)度,直播間便可以實(shí)現(xiàn)多個(gè)Agent的協(xié)同,實(shí)現(xiàn)毫秒級(jí)的響應(yīng)。從這個(gè)角度講,一個(gè)數(shù)字人可以同時(shí)干至少3個(gè)人的活,其直播水平已經(jīng)超越了真人直播間。

在此前今年3月,百度就曾面向商家客戶推出了“一鍵克隆”功能,只需上傳一段直播回放錄屏或一段真人出鏡短視頻,即可生成與真人無(wú)異的數(shù)字人分身,聲音形象和直播間裝修都可以準(zhǔn)備好,實(shí)現(xiàn)了開(kāi)播零門檻。

更重要的是,憑借自研多模態(tài)算法,慧播星攻克了360度大角度側(cè)轉(zhuǎn)、遮擋以及手持等數(shù)行業(yè)難題,借此服飾主播可以手持商品,通過(guò)大角度側(cè)轉(zhuǎn)、大幅度動(dòng)作,讓觀眾看清每一個(gè)細(xì)節(jié),提高轉(zhuǎn)化率。

百度慧播星數(shù)字人的表現(xiàn)也獲得了IDC的高度評(píng)價(jià)。近期發(fā)布的《中國(guó)AI Agent之電商直播數(shù)字人實(shí)測(cè),2Q25》報(bào)告顯示,百度慧播星綜合實(shí)力排名行業(yè)第一,五項(xiàng)測(cè)評(píng)指標(biāo)中,百度慧播星在技術(shù)能力、產(chǎn)品表現(xiàn)、平臺(tái)合規(guī)與穩(wěn)定性、客戶服務(wù)四項(xiàng)均位列第一。

這一套組合拳下來(lái),過(guò)去一年,慧播星數(shù)字人主播數(shù)量累計(jì)超過(guò)10 萬(wàn),其展現(xiàn)出來(lái)的高說(shuō)服力也帶來(lái)了顯著的收益,大盤來(lái)看數(shù)字人直播轉(zhuǎn)化率提升了31%,降低了80%的開(kāi)播成本。

當(dāng)數(shù)字人開(kāi)始接管商業(yè)世界

今年4月,李彥宏在百度25周年的全員信中明確指出,大模型賦能的AI原生應(yīng)用將在2025年繼續(xù)井噴式增長(zhǎng)。

在Tech星球看來(lái),AI原生應(yīng)用爆發(fā)的前提需要滿足三個(gè)條件:落地成本大幅下降、產(chǎn)品能力和效果顯著提升,且場(chǎng)景多元。4月25日,Create2025百度AI開(kāi)發(fā)者大會(huì)的高說(shuō)服力數(shù)字人恰好完全滿足,其實(shí)績(jī)也非??勾?。

今年春節(jié)期間,數(shù)字人讓主播們放了個(gè)好假,但同時(shí)商家卻并沒(méi)有因此業(yè)績(jī)下滑。據(jù)Tech星球不完全統(tǒng)計(jì),今年百度優(yōu)選年貨節(jié)期間,蘇寧易購(gòu)超級(jí)買有10場(chǎng)直播,其中5場(chǎng)直播超過(guò)18個(gè)小時(shí),有些甚至達(dá)到了24小時(shí),這些直播里,幾乎全部由數(shù)字人主導(dǎo),他們貢獻(xiàn)了遠(yuǎn)超真人直播的業(yè)績(jī),數(shù)據(jù)顯示年貨節(jié)期間,該直播間GMV突破了300萬(wàn),訂單量同比提升了50倍。

銷售額大幅提升的同時(shí),企業(yè)并沒(méi)有額外支出更多成本,甚至因?yàn)橛昧藬?shù)字人,成本還下降了。企業(yè)對(duì)數(shù)字人的態(tài)度也從此前的觀望逐漸轉(zhuǎn)向擁抱,他們有了底氣探索更多的賽道,公司的天花板也更高了。

數(shù)字人也正在從電商場(chǎng)景拓展開(kāi)來(lái)。在百度上,用戶可以看到主攻孩子抑郁、厭學(xué)等情緒的觀心實(shí)驗(yàn)室;提供旅游服務(wù)的輕松游旅行等都在使用數(shù)字人直播。未來(lái)景區(qū)里既可以講解歷史,又能直播帶貨的數(shù)字人AI導(dǎo)游;孤獨(dú)經(jīng)濟(jì)下的AI陪伴直播等等,數(shù)字人未來(lái)完全有可能滲透到人類生活中的方方面面。

這并非個(gè)例,而是技術(shù)發(fā)展的必然。a16z 發(fā)布 AI Avatar 數(shù)字人的最新報(bào)告,報(bào)告預(yù)測(cè):現(xiàn)在底層模型的技術(shù)水平已經(jīng)顯著提升,能夠生成質(zhì)量較高、觀看體驗(yàn)較好的 AI 虛擬形象,因此可以肯定地說(shuō),應(yīng)用層面將迎來(lái)快速發(fā)展的機(jī)遇,預(yù)計(jì)該領(lǐng)域?qū)⒃杏龆鄠€(gè)價(jià)值數(shù)十億美元的公司。

現(xiàn)在來(lái)看,數(shù)字人應(yīng)用的爆發(fā)已跨越技術(shù)驗(yàn)證期,正邁入規(guī)模化落地的新臨界點(diǎn)。2025年,數(shù)字人將像水電一樣滲透生活,極低的成本和不輸真人的效果很有可能讓它成為企業(yè)嘗試擁抱大模型和應(yīng)用大模型最好的入口之一。這不是未來(lái),而是正在發(fā)生的現(xiàn)實(shí)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。