色宅男看片午夜大片啪啪,午夜福利一区二区三区在线观看,亚洲熟伦在线视频

文｜新媒科技評論

這個春節(jié)，人工智能無疑成為了社交話題的C位，前有人形機器人在春晚跳扭秧歌而出圈，后有“Deepseek”的強勢崛起。

網(wǎng)友們瘋狂涌入Deepseek，有人找Deepseek算命，有人問Deepseek怎樣才能暴富，還有科技金融行業(yè)的打工人，年還沒有過完，就得忙著加班寫研報、測試模型。

但海外市場對此卻態(tài)度微妙，OpenAI一度宣稱Deepseek“偷竊”了其“技術(shù)成果”，但一轉(zhuǎn)頭，微軟、英偉達等大廠都宣布在自家產(chǎn)品中接入Deepseek，OpenAI CEO山姆·奧特曼更表示Deepseek的R1模型“令人印象深刻”。

國內(nèi)的互聯(lián)網(wǎng)巨頭們也沒有錯失這波Deepseek的熱度，2月6日，有道正式宣布全面擁抱DeepSeek-R1。此外，Hi Echo、有道智云、QAnything等產(chǎn)品也將全面接入DeepSeek的推理能力，并于近日陸續(xù)升級。

一時之間，這場AI大模型的技術(shù)迭代，不知不覺就演變成全球科技行業(yè)的現(xiàn)象級事件，Deepseek也被視為引領(lǐng)大模型行業(yè)從“大而全”到“小而美”的全新變量。

但熱鬧過后，Deepseek還需要回答更多的新問題，全球大模型行業(yè)該如何抓住“變革的火花”，或許才是接下來的關(guān)鍵。

三大變量引爆Deepseek

在普通用戶看來，Deepseek是在此次中美大模型技術(shù)之爭中“一戰(zhàn)成名”，但更早之前，Deepseek便已經(jīng)因為“價格便宜”而被AI圈廣泛關(guān)注。

去年中，國內(nèi)大模型行業(yè)大打“價格戰(zhàn)”，但第一個“挑起戰(zhàn)火”的并非阿里、百度等大廠，而是Deepseek，彼時其新推出的DeepSeek-V2價格僅為 GPT-4-Turbo 的百分之一左右。

此次“降價”也讓Deepseek被冠以“AI界拼多多”之稱，但相較于大廠們的“以價換市場”的慣常做法，Deepseek對于“降價”并沒有太多壓力，因為其降價之后也仍有利潤。

事實上，這才是Deepseek能夠震驚全球科技界的主要原因，其能夠以更低的成本換來更高的性能，顛覆了過去大模型行業(yè)依靠堆顯卡、堆資本來發(fā)展AI的“Scaling law”。

這是因為Deepseek的模型訓(xùn)練路徑不同于傳統(tǒng)通用大模型，以ChatGPT為代表的傳統(tǒng)AI，主要采用監(jiān)督微調(diào)（簡稱 SFT）作為大模型訓(xùn)練的核心環(huán)節(jié)，即通過人工標注數(shù)據(jù)進行監(jiān)督訓(xùn)練，再結(jié)合強化學習進行優(yōu)化，本質(zhì)上大模型并不會思考，只是通過模仿人類思維方式來提升推理能力。

但在1月底發(fā)布的Deepseek-R1-Zero卻顛覆了這一規(guī)則，其對模型架構(gòu)進行了全方位創(chuàng)新，通過單純的強化學習（RL）訓(xùn)練實現(xiàn)推理能力。簡單來說，SFT是人類生成數(shù)據(jù)，機器學習；而RL是機器生成數(shù)據(jù)，機器學習。

除此以外，據(jù)每日財經(jīng)新聞報道，DeepSeek創(chuàng)新性地同時使用了FP8、MLA（多頭潛在注意力）和MoE（利用混合專家架構(gòu)）三種技術(shù)。

其中，相較于其他模型使用的MoE架構(gòu)，DeepSeek-V3的更為精簡有效，其就像是醫(yī)院的“分診制度”，可以將大模型拆分成多個“專家”，訓(xùn)練時分工協(xié)作，推理時根據(jù)任務(wù)分配給最適合的專家模塊。據(jù)悉，Deepseek能夠?qū)o效訓(xùn)練從傳統(tǒng)模型的90%降低至60%。

在Deepseek-R1發(fā)布后，一位Meta員工在美國匿名職場社區(qū)teamblind上留言，稱Deepseek最近的一系列動作讓Meta的生成式AI團隊陷入了恐慌。

據(jù)這位員工爆料，“Meta一個負責AI項目的高管年薪拿出來，就足夠訓(xùn)練Deepseek了”。據(jù)每日經(jīng)濟新聞報道，Deepseek R1的預(yù)訓(xùn)練費用只有557.6萬美元，還不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。

但從實際性能來看，Deepseek-R1已經(jīng)能夠比肩OpenAI-o1正式版，特別是在數(shù)學、代碼、自然語言推理等任務(wù)上。

在美國數(shù)學競賽（AMC）以及全球頂級編程競賽（codeforces）等權(quán)威評測中，DeepSeek-R1-Lite-Preview 模型已經(jīng)大幅超越了 GPT-4o 等頂尖模型，有三項成績還領(lǐng)先于 OpenAI o1-preview。

除了“低成本、高算力”這一突破之外，Deepseek之所以在這個春節(jié)“燃起來”，還因為其竟然不是出自傳統(tǒng)的大廠，而是一家量化基金公司。

Deepseek成立于2023年12月，在此之前，其創(chuàng)始人梁文鋒于2015年便成立了名為“幻方量化”的量化對沖基金，可以說Deepseek的前身其實是服務(wù)于量化交易的。

這樣的背景也為Deepseek增添了更多“看點”，比如梁文鋒之所以不差錢，是因為其在量化交易上賺得風生水起，網(wǎng)友甚至戲稱Deepseek的訓(xùn)練成本是來自于造空英偉達。

還有背靠千億量化基金的梁文鋒，明明可以選擇輕松躺賺，卻選擇投身到全球創(chuàng)新的浪潮里，他坦言“對AGI的好奇與探索比商業(yè)回報更具驅(qū)動力”，這種一往無前的“理想主義”，想讓也讓Deepseek的“故事”變得更加動人。

大廠打不過就加入

不過，技術(shù)上的逆襲，尚不足以徹底震驚科技界，真正引爆Deepseek的變量，其實是“開源”。據(jù)悉，Deepseek已經(jīng)把模型架構(gòu)和參數(shù)開源，在大模型公司普遍選擇閉源的當下，訓(xùn)練數(shù)據(jù)的開源在業(yè)界少有先例。

梁文鋒曾在媒體采訪中表示，“過去很多年，中國公司習慣了別人做技術(shù)創(chuàng)新，我們拿過來做應(yīng)用變現(xiàn)，但這并非是一種理所當然。我們的出發(fā)點不是趁機賺一筆，而是走到技術(shù)的前沿，去推動整個生態(tài)發(fā)展?！?/p>

從商業(yè)角度來看，“開源”是不是一個更佳的策略，尚難以下定論。畢竟訓(xùn)練模型需要成本，招攬用戶也需要推廣費用，從此前字節(jié)豆包大規(guī)模投放廣告、kimi多次接受融資就可以看出，大模型公司有自己的難處。

但對于中國大模型行業(yè)來說，或許正是梁文鋒的“理想主義”，才讓Deepseek能夠成為顛覆行業(yè)格局的“變量”。

一方面，開源將能吸引更多大廠和技術(shù)人才加入，通過共建共創(chuàng)讓Deepseek變得更加強大，從而推動整個人工智能大模型生態(tài)的發(fā)展，形成一個全新的生態(tài)。

梁文鋒曾對媒體表示，公司未來不會像OpenAI一樣選擇從開源走向閉源，“我們認為先有一個強大的技術(shù)生態(tài)更重要” 。

另一方面，對于以O(shè)penAI為代表的競爭對手來說，這也是一個致命的打擊。畢竟，當一個旗鼓相當?shù)?，還是免費的產(chǎn)品出現(xiàn)在消費者面前，大家難免就會進行比較，誰的性價比更高，誰的性能更優(yōu)秀，都需要實打?qū)嵉氖褂眯Ч麃眚炞C，而不僅僅只是“吹泡沫”。

而率先作出選擇的，便是一眾海外大廠，目前包括英偉達、英特爾、亞馬遜、微軟、AMD、等海外科技大廠，均宣布在自家產(chǎn)品中接入Deepseek。

值得一提的是，歐美多國對于Deepseek的安全性、隱私問題依然存在質(zhì)疑。美國多位官員表示正在對Deepseek開展國家安全調(diào)查，包括國防部、國會和NASA等部門均被要求禁用Deepseek。

此外，據(jù)彭博社等媒體報道，微軟還曾調(diào)查 OpenAI 技術(shù)輸出的數(shù)據(jù)是否被中國的Deepseek團隊以未經(jīng)授權(quán)的方式獲取，比如通過“蒸餾技術(shù)”非法獲取其模型輸出數(shù)據(jù)。

但在這些爭議尚未解決之前，大廠們顯然已經(jīng)迫不及待想要加入Deepseek生態(tài)，本質(zhì)上還是基于“利益至上”的原則。

據(jù)斯坦福大學計算機科學系和電子工程系副教授吳恩達表示，OpenAI - o1模型每百萬輸出token 的成本為60美元，而Deepseek-R1 則僅需 2.19 美元，這接近30倍的成本差距，相信大廠們也會算賬。

其次則是生態(tài)效應(yīng)，吳恩達認為，“降價”+“開源”正在將基礎(chǔ)模型層商品化，為應(yīng)用開發(fā)者創(chuàng)造了巨大的機遇。盡早加入這一生態(tài)，讓自家大模型與之相結(jié)合，也有望帶來更多創(chuàng)新體驗，“收攏”部分DeepSeek用戶的需求。

因此，除了海外大廠之外，諸如阿里云、百度云等國內(nèi)大廠也開始集中接入Deepseek，在各自平臺提供的適配服務(wù)，打不過就加入，才能共享創(chuàng)新紅利。

乘上Deepseek的東風

事實上，在開春爆火的Deepseek，不僅為大模型行業(yè)帶來了一陣“春風”，對于普通用戶來說，也帶來了更多新機會。

第一批利用Deepseek搞錢的人已經(jīng)出現(xiàn)了，跟彼時橫空出世的ChatGPT一樣，面對更加智能、更加高效的大模型，AI取代人類的焦慮感，再次成為收割用戶的“武器”。

社交平臺上已經(jīng)出現(xiàn)了不少“如何使用Deepseek進行XXX”的課程，面向社交媒體、電商、廣告等不同行業(yè)的應(yīng)用和變現(xiàn)。

當然，學習新知識肯定是沒錯的，但相較于被焦慮感“收割”，并淪為大V私域流量中的一員，大家不妨根據(jù)自己的實際工作和擅長內(nèi)容，先上手試用一下Deepseek。

目前來看，Deepseek在技術(shù)上確實有意想不到的突破，對于普通用戶來說，其能夠展示思維鏈全過程，更方便人類與AI交流，業(yè)內(nèi)人士甚至稱之為當前最好用的開源模型，但也不需要過度“神化”Deepseek。

首先，從使用體驗來看，Deepseek尚無法承受蜂擁而至的流量。其實，Deepseek在年前便已經(jīng)小范圍的“爆火”，其當時尚能同時使用深度思考和聯(lián)網(wǎng)功能，輸出的文章框架和成文確實比較驚艷。

但隨著使用者不斷增多，目前Deepseek已經(jīng)關(guān)閉了聯(lián)網(wǎng)功能，整理輸出質(zhì)量有較大的下降，且大部分時間Deepseek都呈現(xiàn)“服務(wù)繁忙”的狀態(tài)。

雖然梁文鋒曾表示“商業(yè)化”不是當前首要考慮的問題，但按私募基金的體量來推算“幻方”的資金規(guī)模，千億規(guī)模不等于千億資金體量，“幻方”只是在千億規(guī)模上收取管理費，其跟大廠之間的資金差距還是很大的。

但要繼續(xù)維持C端的使用體驗，Deepseek必然需要燒錢，后續(xù)如何補充資金，還是調(diào)整使用模式，梁文鋒都需要提出更明確的打法。

其次，目前Deepseek在圖文、視頻方面的能力是缺失的，現(xiàn)階段要說Deepseek能夠與頭部閉源模型直接打擂臺，恐怕還為時尚早。

不過，其發(fā)展也給Open AI，以及更多垂直模型帶來了壓力，相信將能在一定程度上推動整個大模型生態(tài)的發(fā)展。

最后，Deepseek依然面臨著政策、數(shù)據(jù)安全等爭議，要走向全球依然是漫漫長路；此外，其在計算資源與算力方面依然受限，這意味著國產(chǎn)硬件還需要繼續(xù)努力，才能支撐軟件的不斷創(chuàng)新。

當然，對于全球大模型行業(yè)來說，有競爭才有動力，就像智能手機行業(yè)一樣，參與者多了，行業(yè)盤子就會越來越多，也才有機會爆發(fā)出更多的機會。

Deepseek的出現(xiàn)就像是國內(nèi)大模型行業(yè)的一點“火花”，既是思維碰撞的突破，也是靈感乍現(xiàn)的瞬間。接下來，相信還需要國內(nèi)大模型行業(yè)在軟硬件方面的持續(xù)創(chuàng)新，才能抓住這一機遇，讓中國科技行業(yè)能夠從“跟隨者”向“引領(lǐng)者”進發(fā)。

文｜新媒科技評論

這個春節(jié)，人工智能無疑成為了社交話題的C位，前有人形機器人在春晚跳扭秧歌而出圈，后有“Deepseek”的強勢崛起。

但熱鬧過后，Deepseek還需要回答更多的新問題，全球大模型行業(yè)該如何抓住“變革的火花”，或許才是接下來的關(guān)鍵。

三大變量引爆Deepseek

除此以外，據(jù)每日財經(jīng)新聞報道，DeepSeek創(chuàng)新性地同時使用了FP8、MLA（多頭潛在注意力）和MoE（利用混合專家架構(gòu)）三種技術(shù)。

在Deepseek-R1發(fā)布后，一位Meta員工在美國匿名職場社區(qū)teamblind上留言，稱Deepseek最近的一系列動作讓Meta的生成式AI團隊陷入了恐慌。

但從實際性能來看，Deepseek-R1已經(jīng)能夠比肩OpenAI-o1正式版，特別是在數(shù)學、代碼、自然語言推理等任務(wù)上。

除了“低成本、高算力”這一突破之外，Deepseek之所以在這個春節(jié)“燃起來”，還因為其竟然不是出自傳統(tǒng)的大廠，而是一家量化基金公司。

大廠打不過就加入

但對于中國大模型行業(yè)來說，或許正是梁文鋒的“理想主義”，才讓Deepseek能夠成為顛覆行業(yè)格局的“變量”。

梁文鋒曾對媒體表示，公司未來不會像OpenAI一樣選擇從開源走向閉源，“我們認為先有一個強大的技術(shù)生態(tài)更重要” 。

而率先作出選擇的，便是一眾海外大廠，目前包括英偉達、英特爾、亞馬遜、微軟、AMD、等海外科技大廠，均宣布在自家產(chǎn)品中接入Deepseek。

但在這些爭議尚未解決之前，大廠們顯然已經(jīng)迫不及待想要加入Deepseek生態(tài)，本質(zhì)上還是基于“利益至上”的原則。

乘上Deepseek的東風

事實上，在開春爆火的Deepseek，不僅為大模型行業(yè)帶來了一陣“春風”，對于普通用戶來說，也帶來了更多新機會。

社交平臺上已經(jīng)出現(xiàn)了不少“如何使用Deepseek進行XXX”的課程，面向社交媒體、電商、廣告等不同行業(yè)的應(yīng)用和變現(xiàn)。

但要繼續(xù)維持C端的使用體驗，Deepseek必然需要燒錢，后續(xù)如何補充資金，還是調(diào)整使用模式，梁文鋒都需要提出更明確的打法。

其次，目前Deepseek在圖文、視頻方面的能力是缺失的，現(xiàn)階段要說Deepseek能夠與頭部閉源模型直接打擂臺，恐怕還為時尚早。

不過，其發(fā)展也給Open AI，以及更多垂直模型帶來了壓力，相信將能在一定程度上推動整個大模型生態(tài)的發(fā)展。

歷史搜索全部刪除

熱門搜索

大廠“擁抱”Deepseek，打不過就加入？

三大變量引爆Deepseek

大廠打不過就加入

乘上Deepseek的東風

評論

大廠“擁抱”Deepseek，打不過就加入？

三大變量引爆Deepseek

大廠打不過就加入

乘上Deepseek的東風

大廠“擁抱”Deepseek，打不過就加入？

三大變量引爆Deepseek

大廠打不過就加入

乘上Deepseek的東風

評論

大廠“擁抱”Deepseek，打不過就加入？

三大變量引爆Deepseek

大廠打不過就加入

乘上Deepseek的東風

大廠“擁抱”Deepseek，打不過就加入？

大廠“擁抱”Deepseek，打不過就加入？