文|壹番財(cái)經(jīng) 鄭亦久
在AI大模型的演進(jìn)似乎放緩甚至陷入停滯的2025年初,國(guó)產(chǎn)大模型DeepSeek的橫空出世,重新點(diǎn)燃了整個(gè)行業(yè)的激情。
它不僅在多項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)中展現(xiàn)出驚人的性能,更通過(guò)開(kāi)源策略獲得了廣泛的社區(qū)支持。一時(shí)間,全球媒體、行業(yè)專家、甚至是機(jī)構(gòu)投資人紛紛給予高度評(píng)價(jià),而這些反饋傳回國(guó)內(nèi)之后有人將其譽(yù)為“國(guó)產(chǎn)AI的里程碑”,更有甚者將其與“國(guó)運(yùn)”掛鉤,于是DeepSeek瞬間形成破圈之勢(shì),并直接登頂微博熱搜第一位。
然而,在這片贊譽(yù)聲中,往往更需要保持清醒的認(rèn)識(shí)。
畢竟在AI領(lǐng)域,我們已經(jīng)目睹過(guò)太多曇花一現(xiàn)的“明星產(chǎn)品”,它們?cè)诙虝旱墓猸h(huán)過(guò)后,要么被市場(chǎng)淘汰,要么被證明徒有其表。
對(duì)于DeepSeek的評(píng)價(jià),既要看到它確實(shí)展現(xiàn)出的技術(shù)路線創(chuàng)新,更要考量其路徑實(shí)現(xiàn)背后的原理以及局限,更重要的是當(dāng)前這個(gè)AI幾乎以日新月異的發(fā)展階段,我們應(yīng)該以什么樣的心態(tài)來(lái)看待技術(shù)創(chuàng)新。
01 DeepSeek憑啥能讓美國(guó)AI界抖一抖?
DeepSeek最先引發(fā)熱潮是在美國(guó),其更是在近期一舉反超ChatGPT,一舉登頂美區(qū)蘋(píng)果應(yīng)用商店免費(fèi)App排行第一,整個(gè)硅谷和AI界都對(duì)這款產(chǎn)品發(fā)出了極強(qiáng)好奇心。
蘋(píng)果應(yīng)用商店免費(fèi)App排行榜
毫無(wú)疑問(wèn),DeepSeek最近發(fā)布的DeepSeek-R1模型在AI領(lǐng)域掀起了一場(chǎng)技術(shù)革新的風(fēng)暴。這款開(kāi)源推理大語(yǔ)言模型基于DeepSeek V3混合專家模型開(kāi)發(fā),在數(shù)學(xué)、編程和推理任務(wù)上達(dá)到了與OpenAI的前沿推理模型o1相媲美的性能,而訓(xùn)練成本卻降低了90-95%。
這一突破不僅展示了開(kāi)源模型在向AGI邁進(jìn)的過(guò)程中正在快速追趕封閉的商業(yè)大模型,更重要的是揭示了一種全新的AI訓(xùn)練范式。
DeepSeek的技術(shù)創(chuàng)新主要體現(xiàn)在以下幾個(gè)方面:
首先是模型訓(xùn)練效率的突破性提升。
DeepSeek V3僅使用了2788K H800訓(xùn)練時(shí)長(zhǎng)(約合560萬(wàn)美元成本)就達(dá)到了接近GPT-4的水平,這一數(shù)字之低令業(yè)界震驚。更重要的是,他們采用了“AI訓(xùn)練AI”的創(chuàng)新方法:使用R1模型生成合成數(shù)據(jù)來(lái)提升V3的能力。
DeepSeek V3測(cè)評(píng)
其次是在純強(qiáng)化學(xué)習(xí)方面的開(kāi)創(chuàng)性嘗試。
DeepSeek實(shí)際上開(kāi)發(fā)了兩個(gè)R1模型:公開(kāi)的R1和更具突破性的R1-Zero。R1-Zero的特別之處在于它完全摒棄了傳統(tǒng)的“基于人類反饋的強(qiáng)化學(xué)習(xí)”(RLHF)方法,而是采用純強(qiáng)化學(xué)習(xí)方式。他們給模型設(shè)置了兩個(gè)獎(jiǎng)勵(lì)函數(shù):一個(gè)用于判斷答案的正確性,另一個(gè)用于評(píng)估思維過(guò)程的合理性。這種方法讓模型能夠同時(shí)嘗試多個(gè)不同的答案,并通過(guò)這兩個(gè)獎(jiǎng)勵(lì)函數(shù)進(jìn)行評(píng)分。
在這個(gè)自主學(xué)習(xí)的過(guò)程中,研究人員觀察到了一個(gè)有趣的現(xiàn)象,他們稱之為“醍醐灌頂”時(shí)刻。就像人類在解決難題時(shí)突然開(kāi)竅一樣,AI模型在訓(xùn)練過(guò)程中學(xué)會(huì)了一種全新的思考方式:它會(huì)停下來(lái)重新思考問(wèn)題,不急于得出結(jié)論。這個(gè)發(fā)現(xiàn)告訴我們,只要給AI足夠的學(xué)習(xí)空間和正確的目標(biāo),它就能自己發(fā)展出復(fù)雜的思維能力,不需要人類事無(wú)巨細(xì)地教導(dǎo)。
然而,這種完全自主學(xué)習(xí)的AI雖然聰明,但它的思考方式對(duì)人類來(lái)說(shuō)很難理解。就像一個(gè)天才學(xué)生用自創(chuàng)的方法解題,雖然答案正確,但老師和同學(xué)都看不懂他的解題過(guò)程。為了解決這個(gè)問(wèn)題,DeepSeek開(kāi)發(fā)了更實(shí)用的R1模型。他們先教會(huì)AI用人類容易理解的方式來(lái)表達(dá)思路,然后再讓它自主學(xué)習(xí)和提升。這個(gè)過(guò)程就像是在保持天才創(chuàng)造力的同時(shí),教會(huì)他如何清晰地表達(dá)自己的想法。
此外,在知識(shí)傳遞結(jié)構(gòu)方面。
DeepSeek發(fā)現(xiàn)了一種讓小型AI模型快速進(jìn)步的方法:用更強(qiáng)大的AI來(lái)給它們上課。這就像是讓一位資深教授來(lái)培養(yǎng)年輕教師,效果往往比讓年輕教師自己摸索要好得多。此發(fā)現(xiàn)非常重要,因?yàn)樗鼮榻鉀QAI普及過(guò)程中的成本問(wèn)題提供了新思路。最令人驚喜的是,通過(guò)該方法訓(xùn)練出的小型模型,在某些數(shù)學(xué)測(cè)試中居然表現(xiàn)得比一些超大型AI還要好。
這些創(chuàng)新成果確實(shí)令人振奮,尤其是在效率提升和成本降低方面的突破,為AI技術(shù)的進(jìn)一步普及帶來(lái)了新的可能。
但在為這些成就歡呼之前,也許還需要更多冷靜的思考:這些創(chuàng)新是否真的如表面看起來(lái)那么完美?DeepSeek的發(fā)展路徑是否真的可持續(xù)?同時(shí),在技術(shù)快速迭代的AI領(lǐng)域,或許更應(yīng)該退后一步以理性和務(wù)實(shí)的態(tài)度來(lái)評(píng)估這些新突破。
02 AI需要祛魅,別再迷信一時(shí)造“新神”
在肯定DeepSeek成就的同時(shí),我們也要清醒地認(rèn)識(shí)到其局限性。
Meta AI研究部門(mén)FAIR的首席科學(xué)家楊立昆最近對(duì)此提出了一個(gè)深刻的觀點(diǎn):當(dāng)人們看到DeepSeek的出色表現(xiàn)就認(rèn)為“中國(guó)在AI領(lǐng)域超越了美國(guó)”時(shí),這其實(shí)是一種誤讀。正確的理解應(yīng)該是“開(kāi)源模型正在超越閉源專有模型”。
他指出,DeepSeek的成功很大程度上得益于開(kāi)源研究和開(kāi)源社區(qū),如來(lái)自Meta的PyTorch和Llama,他們是在其他人的工作基礎(chǔ)上提出新想法并構(gòu)建的。正是因?yàn)檫@些工作都是公開(kāi)發(fā)布和開(kāi)源的,所以每個(gè)人都能從中受益——這正是開(kāi)源研究和開(kāi)源精神的力量所在。
這一評(píng)論其實(shí)真正道出了關(guān)鍵。以DeepSeek最新的模型蒸餾實(shí)踐為例,其將蒸餾后的Llama模型以MIT許可證發(fā)布,實(shí)際上違反了Llama的原始許可協(xié)議。
DeepSeek模型蒸餾實(shí)踐
Meta推出的Llama大模型雖然是“開(kāi)源”的,但并非像MIT許可證那樣完全無(wú)限制,DeepSeek無(wú)權(quán)單方面改變這一許可條款。此問(wèn)題不僅暴露出DeepSeek在知識(shí)產(chǎn)權(quán)管理和商業(yè)合規(guī)性方面的不足,更反映出其發(fā)展很大程度上依賴于開(kāi)源社區(qū)的貢獻(xiàn)。
此外,雖然DeepSeek在技術(shù)層面確實(shí)有創(chuàng)新,但這些創(chuàng)新大多是在現(xiàn)有技術(shù)框架下的優(yōu)化和改進(jìn),而非根本性的突破。
放眼整個(gè)AI領(lǐng)域的發(fā)展歷程,真正的技術(shù)革新往往來(lái)自于對(duì)基礎(chǔ)理論的突破和新范式的創(chuàng)立。從這個(gè)角度來(lái)看,DeepSeek的創(chuàng)新還停留在路徑“改良”層面,距離真正的技術(shù)突破還有很長(zhǎng)的路要走。
其次,在實(shí)際應(yīng)用層面,DeepSeek還面臨著諸多挑戰(zhàn)。
大語(yǔ)言模型的商業(yè)化不僅需要過(guò)硬的技術(shù)實(shí)力,更需要考慮系統(tǒng)穩(wěn)定性、數(shù)據(jù)安全、成本效益等多個(gè)維度。目前DeepSeek還缺乏大規(guī)模商業(yè)應(yīng)用的驗(yàn)證,其在復(fù)雜實(shí)際場(chǎng)景中的表現(xiàn)還有待檢驗(yàn),像是最近兩天因?yàn)闊岫瘸掷m(xù)攀升,開(kāi)始有更多普通用戶涌入后,光是27號(hào)這一天里就已經(jīng)多次出現(xiàn)服務(wù)宕機(jī)的情況。
DeepSeek App截圖
而如今AI產(chǎn)品的一大營(yíng)收來(lái)源其實(shí)還是企業(yè)級(jí)應(yīng)用,在這一場(chǎng)景中穩(wěn)定性和可靠性的要求往往比簡(jiǎn)單的性能指標(biāo)更為重要。
從產(chǎn)業(yè)發(fā)展的角度來(lái)看,當(dāng)前AI領(lǐng)域已經(jīng)進(jìn)入深度競(jìng)爭(zhēng)階段。領(lǐng)先企業(yè)不僅在技術(shù)上持續(xù)投入,更在積極構(gòu)建完整的生態(tài)系統(tǒng)。
相比之下,DeepSeek還顯得有些單薄。僅靠開(kāi)源策略和技術(shù)創(chuàng)新,很難在激烈的市場(chǎng)競(jìng)爭(zhēng)中建立持續(xù)的優(yōu)勢(shì)。如何將技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為市場(chǎng)競(jìng)爭(zhēng)力,如何建立可持續(xù)的商業(yè)模式,這些都是DeepSeek亟待解決的問(wèn)題。
與此同時(shí),DeepSeek這一系列方法本身也被反饋到了開(kāi)源社區(qū)中,顯然后續(xù)還會(huì)有更多公司基于其技術(shù)和理論進(jìn)一步向前發(fā)展。
更重要的是,我們需要重新思考對(duì)AI技術(shù)創(chuàng)新的態(tài)度。
在當(dāng)前AI發(fā)展的熱潮中,過(guò)度追捧某個(gè)特定產(chǎn)品或技術(shù)方案是非常危險(xiǎn)的信號(hào)。技術(shù)發(fā)展是一個(gè)漸進(jìn)的過(guò)程,需要在不斷試錯(cuò)和改進(jìn)中尋找最優(yōu)解。過(guò)高的期待不僅可能給企業(yè)帶來(lái)不必要的壓力,還可能誤導(dǎo)整個(gè)行業(yè)的發(fā)展方向。
正如DAIR.AI創(chuàng)始人Elvis所說(shuō)的:“所有對(duì)DeepSeek-R1的陰謀論和過(guò)度解讀都令人尷尬。我們應(yīng)該回歸DeepSeek-R1的學(xué)術(shù)和 AI 應(yīng)用,從研究者的角度看到強(qiáng)化學(xué)習(xí)的價(jià)值,從開(kāi)發(fā)者的角度看到更強(qiáng)的模型能力和本地模型場(chǎng)景。
而不是讓這些虛假的敘事蒙蔽了你的眼睛,使你錯(cuò)過(guò)了DeepSeek-R1所能帶來(lái)的價(jià)值和機(jī)遇。開(kāi)源研究和開(kāi)源精神依然蓬勃發(fā)展?!?/p>
這或許才是面對(duì)創(chuàng)新真正理性且審慎的態(tài)度——給予技術(shù)成長(zhǎng)必要的時(shí)間和空間并專注于技術(shù)本身,而非在某種不知所以然的盲目對(duì)比中輕言勝負(fù)已分,或是將一次細(xì)分領(lǐng)域的技術(shù)演進(jìn)與某種宏大敘事強(qiáng)行綁定。
對(duì)于DeepSeek而言,通過(guò)站在前人積累之上做出技術(shù)決策實(shí)現(xiàn)創(chuàng)新,本身就證明了其能力和價(jià)值。當(dāng)下,整個(gè)開(kāi)源社區(qū)的正面回應(yīng)也肯定了這一正反饋的可行性。之后,其需要做的則是進(jìn)一步拓寬其技術(shù)的衍生并不斷深化研究成果。
站在更宏觀的角度而言,DeepSeek則更多證明了AI技術(shù)的競(jìng)爭(zhēng)與創(chuàng)新尚未迎來(lái)終局。
整個(gè)行業(yè)的創(chuàng)新也絕非僅僅通過(guò)囤積算力、無(wú)限資金就能完全形成壁壘。這也為更多中小型創(chuàng)業(yè)公司重新點(diǎn)燃了希望,畢竟誰(shuí)也不希望AI行業(yè)早早變成如互聯(lián)網(wǎng)行業(yè)一樣“贏家通吃”的垃圾時(shí)間。