文 | 硅基研究室 kiki 謝浩
大模型競(jìng)逐邁入第三年,來(lái)自中國(guó)杭州的一家本地初創(chuàng)企業(yè)DeepSeek如同一條鯰魚(yú),徹底攪活了全球大模型的生態(tài)圈。
從蛇年春節(jié)開(kāi)始,一場(chǎng)圍繞“接入DeepSeek”的競(jìng)賽就席卷中國(guó)AI行業(yè)。短短一個(gè)多月內(nèi),從芯片廠商、云廠商、算力服務(wù)商、軟件廠商再到面向終端用戶的各類硬件廠商,超百家中國(guó)公司已宣布加入DeepSeek朋友圈,借其開(kāi)源模型能力,提升自身的業(yè)務(wù)想象力。
毫無(wú)疑問(wèn),DeepSeek讓大模型更普及了,但與洶涌流量并行而來(lái)的還有一個(gè)更關(guān)鍵的問(wèn)題——算力。
圍繞著這個(gè)關(guān)鍵問(wèn)題,市場(chǎng)的態(tài)度經(jīng)歷了“反復(fù)橫跳”:初期階段,DeepSeek低算力成本的特性,曾經(jīng)一度重創(chuàng)英偉達(dá)等算力廠商的股價(jià);在這之后,隨著訪問(wèn)用戶的激增和私有化部署的需求,算力概念股又強(qiáng)勢(shì)翻紅,供不應(yīng)求。近期,DeepSeek還對(duì)外公布了其理論成本和利潤(rùn)率,再度引發(fā)AI圈討論。
隨著DeepSeek朋友圈的不斷擴(kuò)大,芯片硬件側(cè)由OpenAI所掀起的軍備競(jìng)賽,究竟能否延續(xù)?這場(chǎng)算力游戲,又會(huì)帶來(lái)哪些新的規(guī)則?
01 DeepSeek“朋友圈”各懷心思
DeepSeek以低成本、高性能著稱,按照官方提供的數(shù)據(jù),每個(gè)H800節(jié)點(diǎn)上每秒有73.7k/14.8k個(gè)輸入/輸出tokens,理論單日總收入562027美元,成本利潤(rùn)率545%,其「中國(guó)式創(chuàng)新」激活了國(guó)產(chǎn)算力生態(tài)。
而從DeepSeek的「朋友圈」中來(lái)看,表現(xiàn)最為積極、速度最快的可以分為四類玩家:基礎(chǔ)層(包括國(guó)產(chǎn)芯片廠商、云廠商)、中間層(AI Infra廠商)以及在B、C兩端的軟、硬件廠商。
據(jù)「硅基研究室」不完全統(tǒng)計(jì),第一批接入DeepSeek的企業(yè)就接近百余家。
“一天有十幾個(gè)咨詢,從春節(jié)復(fù)工后就沒(méi)有休息”。一位AI Infra廠商商務(wù)BD告訴「硅基研究室」。
作為連接大模型底層算力和下游應(yīng)用的中間層,AI Infra廠商既是第一批接住DeepSeek“流量”的玩家,也是第一批吃到流量外溢的受益者。
AI Infra廠商硅基流動(dòng)創(chuàng)始人袁進(jìn)輝曾在朋友圈復(fù)盤(pán),DeepSeek出圈后,他們?cè)?月1日就迅速找到華為,完成DeepSeek-R1和V3在昇騰生態(tài)的適配工作。
與AI Infra廠商有著相似敏銳度的,還有國(guó)產(chǎn)芯片廠商,某智算中心服務(wù)商李楊(化名)的直接體感是,此輪DeepSeek熱潮中“國(guó)產(chǎn)AI芯片廠商這輪反應(yīng)速度很快,幾乎和英偉達(dá)這些國(guó)際玩家同步接入?!?/p>
緊隨其后的就是云廠商和面向終端的軟硬件廠商。
云廠商方面,“互聯(lián)網(wǎng)云”幾乎都趕在春節(jié)期間上線了基于DeepSeek模型的API服務(wù),打起了新一輪的「低API價(jià)格+開(kāi)源模型戰(zhàn)」,云端算力推動(dòng)DeepSeek加速滲透不同行業(yè)。
硬件方面,端側(cè)手機(jī)廠商也是最先擁抱DeepSeek的首批玩家,而在用戶最有直觀感受的軟件應(yīng)用側(cè),包括騰訊在內(nèi)的大廠攜「超級(jí)應(yīng)用+DeepSeek」卷入競(jìng)爭(zhēng),給大模型競(jìng)逐再添一把火。
分食DeepSeek流量背后,不同玩家其實(shí)「各懷心思」。從算力層來(lái)看,有著相對(duì)充足算力儲(chǔ)備的云廠商顯然動(dòng)力更強(qiáng)。云廠商是中國(guó)算力市場(chǎng)的投資主力,向外它們既會(huì)大規(guī)模投資固定資產(chǎn),包括采購(gòu)芯片、服務(wù)器、租賃土地建數(shù)據(jù)中心等,對(duì)內(nèi)也會(huì)自研芯片。
以阿里和百度為例,2024年全年,阿里資本支出總計(jì)超724億元,百度超82億元,據(jù)《財(cái)經(jīng)》此前報(bào)道,阿里、字節(jié)跳動(dòng)也早已完成10萬(wàn)卡級(jí)別的算力儲(chǔ)備。
除此以外,DeepSeek通過(guò)模型壓縮、稀疏計(jì)算、混合精度訓(xùn)練等多種技術(shù)手段驗(yàn)證了低算力成本復(fù)現(xiàn)高性能模型的可行性,也給自研芯片的大廠帶來(lái)了“自供血”機(jī)會(huì)。
“自供血、對(duì)外租賃,云廠商有自己的業(yè)務(wù)閉環(huán)”。聯(lián)想控股副總裁于浩告訴「硅基研究室」。
其次,在戰(zhàn)略層,借自有云業(yè)務(wù),BAT和字節(jié)跳動(dòng)借DeepSeek可以達(dá)成兩大意圖:一是通過(guò)DeepSeek這一超級(jí)流量入口,與自身產(chǎn)品協(xié)同,短期承接DeepSeek的流量。二是有助于鞭策內(nèi)部團(tuán)隊(duì),在對(duì)比中提升自身模型能力。
前者更像是移動(dòng)互聯(lián)網(wǎng)時(shí)代大廠們擅長(zhǎng)的打法,資深芯片專家、中存算董事長(zhǎng)陳巍認(rèn)為DeepSeek出現(xiàn)之后改變了大眾對(duì)大模型商業(yè)本質(zhì)的思考:“原先公眾認(rèn)為大模型它可能是一個(gè)在日常對(duì)話、應(yīng)用辦公的工具,但事實(shí)上,DeepSeek出現(xiàn)之后,大模型也可以成為一個(gè)超越互聯(lián)網(wǎng)、甚至超越原先這些操作系統(tǒng)的超級(jí)流量入口?!?/p>
近30天DeepSeek移動(dòng)端日活數(shù)據(jù)走勢(shì)來(lái)源:Sensor Tower
Sensor Tower的數(shù)據(jù)顯示,截至2月24日,DeepSeek移動(dòng)端的日活數(shù)據(jù),已由超過(guò)1500萬(wàn)的峰值,下滑至700萬(wàn)左右。與之對(duì)應(yīng)的是,元寶、豆包、通義等均實(shí)現(xiàn)了訪問(wèn)量和日活的大幅增長(zhǎng)。
于浩提到,DeepSeek的模型能力有目共睹,有流量有市場(chǎng),且前期在C端以免費(fèi)模式實(shí)現(xiàn)DAU的閃電式擴(kuò)張,頭部大廠自然會(huì)迅速跟進(jìn)。
即便是放眼整個(gè)中國(guó)互聯(lián)網(wǎng)歷史上,像DeepSeek這樣得到全行業(yè)追捧和爭(zhēng)搶接入的產(chǎn)品,除了去年的“原生鴻蒙熱”,幾乎很難找到其他案例。
最后,回到應(yīng)用側(cè),DeepSeek以低成本和低功耗支持復(fù)雜AI任務(wù)運(yùn)行,推動(dòng)AI進(jìn)一步下沉至智能終端、汽車(chē)智駕和產(chǎn)業(yè)側(cè)。
以廠商為例,華為、榮耀、OPPO、vivo、魅族、努比亞等手機(jī)品牌宣布在AI助手接入DeepSeek。
長(zhǎng)期來(lái)看,手機(jī)廠商集體擁抱DeepSeek,一方面有利于其擴(kuò)充云端AI生態(tài),另一方面,也有望不斷拉動(dòng)手機(jī)SoC需求量,在端側(cè)、邊緣側(cè),誕生更多的軟硬件升級(jí)。
高通CEO安蒙近期在財(cái)報(bào)電話會(huì)上表示:“DeepSeek-R1和其他類似模型最近表明,AI模型正在發(fā)展得更快、更小、更強(qiáng)大、更高效,并且現(xiàn)在能夠直接在設(shè)備上運(yùn)行?!?/p>
02 算力與有效算力:一邊閑置,一邊短缺
伴隨“接入DeepSeek”浪潮而來(lái)的,是服務(wù)器繁忙的提示。
如果從用戶直接體驗(yàn)來(lái)看,服務(wù)器繁忙、延遲加劇,就連硅基流動(dòng)也開(kāi)始不得不限流,尋求更多的算力資源,特別當(dāng)攜移動(dòng)互聯(lián)網(wǎng)時(shí)代超級(jí)應(yīng)用入場(chǎng)的大廠,龐大的用戶量更加劇了對(duì)算力的焦慮。
硅基流動(dòng)袁進(jìn)輝宣布因需求大開(kāi)始限流
這些DeepSeek“朋友圈”,它們的算力到底夠不夠?
「硅基研究室」多方了解到,在這一問(wèn)題上,行業(yè)目前的共識(shí)是短期算力洗牌,長(zhǎng)期算力短缺。
「短期算力洗牌」指的是DeepSeek打破了過(guò)去模型廠商“大力出奇跡”的敘事,它在模型架構(gòu)、預(yù)訓(xùn)練和推理側(cè)的系統(tǒng)級(jí)工程手段,拉低了模型部署的算力門(mén)檻,短期內(nèi)給國(guó)產(chǎn)芯片、算力服務(wù)商等整合國(guó)產(chǎn)算力、推動(dòng)國(guó)產(chǎn)算力洗牌提供了機(jī)會(huì)窗口。
具體來(lái)看又可以分為兩方面,一是給國(guó)產(chǎn)芯片提供了更多機(jī)會(huì);二是解部分智算中心算力閑置的困局。
關(guān)于第一點(diǎn),一直以來(lái),強(qiáng)勁性能都是英偉達(dá)高端GPU的護(hù)城河,也是起步較晚的國(guó)產(chǎn)芯片的一大軟肋。
DeepSeek的出現(xiàn)一定程度上降低了對(duì)高性能芯片的依賴,作為采用MoE架構(gòu)的大模型,DeepSeek對(duì)芯片訓(xùn)練性能的要求并不高,即便是像英偉達(dá)H20這樣的性能閹割版GPU,也可以勝任DeepSeek的本地化部署需求,甚至成為了目前渠道端的“熱銷(xiāo)貨”。
一位芯片渠道商告訴「硅基研究室」,H20 141GB八卡服務(wù)器目前是120萬(wàn)一臺(tái),是期貨,要等4-6周,96GB H20八卡服務(wù)器還有不少現(xiàn)貨,但“每天一個(gè)價(jià)”。
相較于訓(xùn)練場(chǎng)景,DeepSeek對(duì)于硬件側(cè)的需求更多聚焦在“堆料環(huán)節(jié)”。
陳巍告訴「硅基研究室」,“像DeepSeek這樣的超大超稀疏MoE模型,顯存遠(yuǎn)遠(yuǎn)不夠用。從產(chǎn)業(yè)角度而言,適配高端GPU的高帶寬存儲(chǔ)器(HBM)又很貴?!?/p>
這意味著,單純靠增大GPU顯存來(lái)適配DeepSeek,會(huì)憑空增加巨大的成本。
這也是為什么,業(yè)內(nèi)一直在探索更具性價(jià)比的部署方案。“一種合理的部署方式就是CPU/GPU多專家多顯卡的部署方案,還有一種是直接用CPU的內(nèi)存去充當(dāng)不常用細(xì)分專家的存儲(chǔ)緩存?!标愇≌f(shuō)。
而這兩種方案所對(duì)應(yīng)的“算力性價(jià)比”和“異構(gòu)協(xié)同”能力,正是國(guó)產(chǎn)芯片長(zhǎng)期發(fā)力的差異化優(yōu)勢(shì)。
另有大模型行業(yè)人士提到,國(guó)產(chǎn)生態(tài)對(duì)DeepSeek也并不陌生,2024年DeepSeek發(fā)布第二代開(kāi)源大模型DeepSee-V2時(shí),硅基流動(dòng)就基于英偉達(dá)生態(tài)上線了推理服務(wù),對(duì)其模型架構(gòu)等方面也十分熟悉。
AI Infra廠商所做的工作涵蓋了數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、部署和應(yīng)用整合等,硅基流動(dòng)主要通過(guò)其模型云服務(wù)平臺(tái)SiliconCloud、大語(yǔ)言模型推理引擎SiliconLLM等產(chǎn)品,讓模型能力能按需調(diào)用。打個(gè)比方,它們相當(dāng)于是一個(gè)“廚師”,將原始算力資源加工成符合用戶需求的“成品菜”,自上線DeepSeek R1/V3推理服務(wù)后,SimilarWeb數(shù)據(jù)顯示,給硅基流動(dòng)帶來(lái)了數(shù)十倍的流量增長(zhǎng),目前SiliconCloud已獲得了超三百萬(wàn)的用戶。
而對(duì)一些部署國(guó)產(chǎn)芯片的智算中心而言,DeepSeek出圈也短期解決了算力閑置和碎片化問(wèn)題,上述智算中心服務(wù)商李楊算過(guò)一筆賬,中國(guó)智算中心項(xiàng)目目前已超過(guò)600個(gè)(包括在建),各地也在興建千卡、萬(wàn)卡算力資源池。
據(jù)機(jī)構(gòu)「IDC圈」不完全統(tǒng)計(jì),截至2024年11月20日,中國(guó)智算中心項(xiàng)目已經(jīng)達(dá)到634個(gè)。
轟轟烈烈的“算力浪潮”之下,為何還會(huì)出現(xiàn)「閑置問(wèn)題」?
在李楊看來(lái),DeepSeek出圈前,國(guó)產(chǎn)算力中心缺少一個(gè)成本低、性能好且開(kāi)源的模型?!爸撬阒行拇蠖嗍菄?guó)產(chǎn)卡,一個(gè)大模型火了,每次都要適配一堆,加上人力有限,沒(méi)有好的開(kāi)源模型,所以很多最后沒(méi)有用起來(lái)。”
另一個(gè)原因在于,算力中心主要面向產(chǎn)業(yè)、學(xué)界等,客戶對(duì)算力成本也很敏感。過(guò)去在推理側(cè),智算中心以單卡形式提供算力服務(wù),智算中心的集群規(guī)?;?yīng)并沒(méi)有凸顯,國(guó)產(chǎn)算力得不到有效消耗。
“成本和產(chǎn)能就是主要問(wèn)題,產(chǎn)能低的芯片價(jià)格高,只有產(chǎn)能穩(wěn)定才能有規(guī)模效應(yīng),降低智算中心成本?!崩顥罡嬖V「硅基研究室」。
但DeepSeek打破了這個(gè)窘境:首先,國(guó)產(chǎn)芯片廠商反應(yīng)迅速,其次,作為李楊口中一個(gè)真正“好的開(kāi)源大模型”,它帶動(dòng)了上下游生態(tài),疊加政策驅(qū)動(dòng),推動(dòng)過(guò)去閑置的國(guó)產(chǎn)算力真正地用起來(lái)。
除此以外,作為中間層的AI Infra廠商也在迅速整合生態(tài)、加速算力市場(chǎng)洗牌,在DeepSeek牽引下,比如推出敏捷式的多并發(fā)一體機(jī),以軟硬件一體化,提供更多元、高效的推理服務(wù)解決方案。
但短期洗牌過(guò)后,長(zhǎng)期來(lái)看,算力還是短缺的。
訓(xùn)練和推理是AI芯片的主要任務(wù)場(chǎng)景,DeepSeek帶動(dòng)智能算力結(jié)構(gòu)變化,推動(dòng)Scaling Law向后訓(xùn)練、推理階段轉(zhuǎn)移。
據(jù)IDC數(shù)據(jù),2024年,中國(guó)智能算力規(guī)模達(dá)725.3百億億次/秒(EFLOPS),同比增長(zhǎng)74.1%,增幅是同期通用算力增幅(20.6%)的3倍以上。分結(jié)構(gòu)來(lái)看,未來(lái)智能算力內(nèi)部訓(xùn)練算力占比會(huì)下滑至27.4%,推理算力占比將上升到72.6%。
推理算力猛漲的背后,是行業(yè)對(duì)“AI加速滲透千行百業(yè)”的期待。
民生證券以目前日活量、日均token調(diào)用量為基礎(chǔ),對(duì)“超級(jí)應(yīng)用”接入DeepSeek做出了保守估算,10億級(jí)別DAU應(yīng)用接入DeepSeek且全面普及使用后,所需的推理算力規(guī)模約為28萬(wàn)張H20。
東吳證券也以AI手機(jī)為例,測(cè)算得到端側(cè)算力需求在2024-2027年間基本維持翻倍以上的增速,AI手機(jī)云端算力需求折算成Blackwell GPU卡的FP8算力,在2025年的需求量約為12萬(wàn)張。
“算力永不眠。”一位大模型行業(yè)人士向「硅基研究室」這樣解釋,可以從大廠公布的Token消耗量粗暴理解算力長(zhǎng)期需求。
去年12月18日,字節(jié)公布豆包通用大模型日均Token消耗量已超4萬(wàn)億,百度在去年8月公布文心一言通用大模型日均處理Tokens文本超1萬(wàn)億,而據(jù)火山引擎智能算法負(fù)責(zé)人吳迪此前預(yù)測(cè),2027年豆包每天Token消耗量預(yù)計(jì)超過(guò)100萬(wàn)億,是原來(lái)的100倍以上。
上述大模型行業(yè)人士稱,考慮到未來(lái)視頻推理、用戶量增長(zhǎng)等因素,推理算力需求長(zhǎng)期或向百萬(wàn)卡邁進(jìn),“長(zhǎng)期算力難以準(zhǔn)確估計(jì)”。
事實(shí)上,中國(guó)科技大廠已經(jīng)進(jìn)入新一輪的擴(kuò)張周期——以阿里近兩年資本支出為例,分季度呈現(xiàn)出高增趨勢(shì),部分季度甚至呈現(xiàn)三位數(shù)高增,阿里管理層在最新財(cái)報(bào)電話會(huì)給出的指引是——未來(lái)三年在云和AI的基礎(chǔ)設(shè)置投入將超越過(guò)去十年的總和,約為3800億元。
據(jù)「硅基研究室」不完全統(tǒng)計(jì),開(kāi)年后,多家中國(guó)云廠商宣布新節(jié)點(diǎn)計(jì)劃,阿里云在泰國(guó)、墨西哥新數(shù)據(jù)中心先后官宣啟用。
比中國(guó)科技大廠更早進(jìn)入算力投資的是海外科技大廠,「硅基研究室」在《「DeepSeek恐慌」,為何難擋微軟們瘋狂撒錢(qián)?》中提到,拉長(zhǎng)時(shí)間線看,從2023年Q2開(kāi)始,微軟、Meta、亞馬遜和谷歌的資本支出就呈現(xiàn)出明顯的上升趨勢(shì)。
如果按「資本密集度」(資本支出占營(yíng)收比重)這一指標(biāo)看,2024年,微軟、Meta、亞馬遜和谷歌資本支出占總營(yíng)收的17.2%,這一數(shù)字甚至高于上一輪大型能源公司的資本支出投入。
這究竟是一種害怕錯(cuò)過(guò)的情緒,還是被擁躉的“杰文斯悖論”真相?沒(méi)有人能給出確切的答案。
此前Meta創(chuàng)始人扎克伯格也被彭博主持人問(wèn)到:“數(shù)據(jù)中心的投資到底是不是泡沫?”無(wú)法正面回答的扎克伯格,只能從互聯(lián)網(wǎng)泡沫里找答案:“許多所謂的泡沫最終也會(huì)變得很有價(jià)值,這只是一個(gè)時(shí)間問(wèn)題,我不知道AI最終會(huì)怎么發(fā)展,還是很難預(yù)測(cè)的。”
03 “算力游戲”與“效率游戲”
比起討論「是不是泡沫」,國(guó)產(chǎn)算力現(xiàn)階段還有更需要做的事。
于浩認(rèn)為,這幾年國(guó)內(nèi)算力發(fā)展可以分為兩個(gè)階段:一是“小馬拉大車(chē)”,以追為始,集體將向OpenAI看齊,明星企業(yè)大量融資但望卡興嘆;二是“小米加步槍”,DeepSeek出圈破局,將每口糧食都吃在刀刃上,每顆子彈都瞄在靶心上,軟硬兼施,壓榨算力優(yōu)化到極致。
“行業(yè)需要更多的高性價(jià)比算力”,從2003年就開(kāi)始在清華實(shí)驗(yàn)室接觸人工智能的陳巍這樣總結(jié)。
在陳巍看來(lái),首先是堅(jiān)定地支持像DeepSeek這樣有價(jià)值的國(guó)產(chǎn)自主創(chuàng)新;其次是要積極復(fù)現(xiàn)DeepSeek的技術(shù)路線,以及在具體業(yè)務(wù)場(chǎng)景中“邊跑邊落地更具性價(jià)比”的算力方案?!按蠹乙嗟刂С窒馜eepSeek這樣的一個(gè)跨界聯(lián)合創(chuàng)新,而不僅僅是單點(diǎn)創(chuàng)新?!?/p>
單靠DeepSeek的一己之力,很難撬動(dòng)硬件端國(guó)際大牌們的護(hù)城河。
以此前媒體所報(bào)道的“DeepSeek擊穿CUDA生態(tài)”為例,本質(zhì)上只是DeepSeek依托PTX(Parallel Thread Execution,CUDA生態(tài)內(nèi)部的中間指令集),繞過(guò)了CUDA生態(tài)的高層API,越級(jí)直接指揮、優(yōu)化底層硬件,但上述技術(shù)路線本質(zhì)上仍然在英偉達(dá)的框架內(nèi)尋求突破。
即便是聚焦技術(shù)路線創(chuàng)新DeepSeek,也仍然沒(méi)有完全繞過(guò)英偉達(dá)CUDA生態(tài),這意味著,在國(guó)產(chǎn)AI芯片側(cè),借DeepSeek之勢(shì),抱團(tuán)取暖,建立國(guó)內(nèi)自主可控的類CUDA生態(tài)是長(zhǎng)期任務(wù)。
一位不愿透露姓名的服務(wù)器專家向「硅基研究室」表示,國(guó)產(chǎn)AI芯片現(xiàn)階段仍需要基于大模型做專門(mén)設(shè)計(jì),例如“低精度高緩存”,加快支持FP8數(shù)據(jù)類型(DeepSeek采用了 FP8混合精度訓(xùn)練),讓推理更加便宜的同時(shí),也利于下游服務(wù)器廠商的設(shè)計(jì)。
在云廠商及算力服務(wù)商側(cè),在豪賭之外,需要算大模型的經(jīng)濟(jì)賬——除了采購(gòu)芯片外,數(shù)據(jù)中心建設(shè)還包括了能源配套、人力配套(運(yùn)維、研發(fā))和數(shù)據(jù)資產(chǎn)等成本支出。
除此以外,在大模型抵達(dá)最終訓(xùn)練前,前期研究、所使用的數(shù)據(jù)訓(xùn)練等各環(huán)節(jié)的試錯(cuò)成本,以及人員薪酬等這些也都是總成本的一部分,模型廠商并不會(huì)公開(kāi)這些隱形成本。
因此,如何在算力建設(shè)的每一環(huán)降低資源浪費(fèi),這既考驗(yàn)大廠各家的Infra能力,也考驗(yàn)自身的預(yù)期管理。
海外云廠商的普遍做法有延長(zhǎng)服務(wù)器折舊周期,與能源公司合作等手段,有的也及時(shí)止損。此前微軟就被曝出暫停了OpenAI計(jì)劃使用的威斯康星州人工智能數(shù)據(jù)中心的部分建設(shè),原因是高估了部分地區(qū)的算力需求。
一邊更合理地規(guī)劃資源,提升算力利用率。另一邊,巧妙施展財(cái)技,保證利潤(rùn)率水平,這也是后續(xù)云廠商反應(yīng)在基本面上的趨勢(shì)。具體到模型側(cè),擁抱開(kāi)源、持續(xù)優(yōu)化算法,已經(jīng)成為了當(dāng)前各大廠商的階段共識(shí)。
與此同時(shí),在應(yīng)用側(cè)推動(dòng)產(chǎn)品爆發(fā)、落地,也成為了廠商們拓展“算力故事”的重點(diǎn)。根據(jù)「硅基研究室」多方了解,C端的個(gè)人Agent、B端的企業(yè)私有化部署以及G端的政務(wù)公共智算云,則是行業(yè)目前關(guān)注的三大方向。
如果說(shuō),過(guò)去OpenAI掀起的是一場(chǎng)算力游戲,那么DeepSeek出圈后,這場(chǎng)游戲還將繼續(xù),只不過(guò)它有了新的定語(yǔ),這是一場(chǎng)“算力效率”的游戲。
盡管一度被砸掉6000億美金市值,黃仁勛還是多次對(duì)DeepSeek給予了正面評(píng)價(jià),最新的財(cái)報(bào)電話會(huì)議中,他說(shuō):“感謝DeepSeek,它開(kāi)源了一個(gè)絕對(duì)世界級(jí)的推理模型?!?/p>