文|IT時(shí)報(bào)記者 賈天榮
編輯|郝俊慧 孫妍
黃仁勛發(fā)表CES“科技春晚”演講后一夜間,英偉達(dá)市值蒸發(fā)超1.6萬(wàn)億元。
這令人有些意想不到,就在一天前,英偉達(dá)總市值飆升8800億元,差點(diǎn)創(chuàng)歷史新高。大家似乎都在期待,這家2024年全球市值漲幅最大的公司將在新的一年里帶來(lái)何種震撼,而在這場(chǎng)約90分鐘的演講中,作為首席執(zhí)行官的黃仁勛確實(shí)顯示出更大的野心。
北京時(shí)間2025年1月7日10:46,黃仁勛身著亮閃閃的“新皮膚”亮相CES,開(kāi)場(chǎng)時(shí)他輕松地問(wèn)道:“你們喜歡我的夾克嗎?”
演講中,黃仁勛用Grace Blackwell NVLink72的巨型芯片充當(dāng)盾牌,Cos(角色扮演)美國(guó)隊(duì)長(zhǎng),號(hào)稱要超越世界最快超級(jí)計(jì)算機(jī),緊接著又取出拳頭大小的Project Digits ,定義為“全球最小的個(gè)人AI超級(jí)計(jì)算機(jī)”,起售價(jià)3000美元(約人民幣21980元)。
發(fā)布會(huì)后,英偉達(dá)股價(jià)一度上漲2%,創(chuàng)歷史新高,隨后一路跳水,分析認(rèn)為,這或與黃仁勛未能對(duì)短期目標(biāo)有清晰闡釋有關(guān)。
不過(guò),黃仁勛或許并不在意這些。從新夾克、新顯卡,到全新超級(jí)AI PC再到雄心勃勃的世界基礎(chǔ)模型,英偉達(dá)正在構(gòu)建自己的AI宇宙,而奇點(diǎn)何時(shí)到來(lái)?
最強(qiáng)顯卡性能翻倍
“機(jī)器學(xué)習(xí)改變了每一個(gè)應(yīng)用程序的構(gòu)建方式、計(jì)算方式以及超越這些的可能性,GPU以及所有與AI相關(guān)的技術(shù),都是AI普及的基礎(chǔ)。如今,AI正回歸GeForce?!毖葜v伊始,黃仁勛便直接發(fā)布了本次CES最受期待和矚目的產(chǎn)品——GeForce RTX 50系列GPU。
該系列采用英偉達(dá)Blackwell架構(gòu),主要面向游戲玩家、創(chuàng)作者和開(kāi)發(fā)者,這一系列GPU中,包括號(hào)稱目前世界上速度最快的顯卡GeForce RTX 5090。黃仁勛表示,其速度是上一代RTX 4090的兩倍,搭載920億個(gè)晶體管和4000 AI TOPS,并支持每秒高達(dá)1000萬(wàn)TOPS(萬(wàn)億次操作)的AI運(yùn)算能力,是上一代Ada架構(gòu)的三倍,售價(jià)1999美元(約人民幣16450元)。
新的GPU架構(gòu)包含多項(xiàng)創(chuàng)新技術(shù),其中包括采用Micron的G7內(nèi)存技術(shù),提供1.8TB每秒的帶寬,幾乎是上一代GPU內(nèi)存帶寬的兩倍;而B(niǎo)lackwell系列的可編程著色器不僅能夠完美執(zhí)行傳統(tǒng)的圖形計(jì)算任務(wù),還能高效并行處理復(fù)雜的神經(jīng)網(wǎng)絡(luò),推動(dòng)AI模型的迅速推理與訓(xùn)練。這一系列的突破,顯著提升了計(jì)算效率,并大幅降低了AI應(yīng)用的能耗。
此外,英偉達(dá)還推出了 GeForce RTX 5080,售價(jià)999美元;RTX 5070 Ti, 售價(jià)749美元;RTX 5070,售價(jià)549美元,預(yù)計(jì)將于本月底上市。值得一提的是,這款售價(jià)549美元的顯卡,性能堪比1600美元的RTX 4090。
黃仁勛還介紹,得益于AI技術(shù),英偉達(dá)能夠?qū)lackwell顯卡縮小并集成到筆記本電腦中,搭載上述顯卡的游戲筆記本電腦,售價(jià)從1299美元至2899美元不等,將從今年3月起開(kāi)始發(fā)貨。
“這就是人工智能令人難以置信的能力之一,它正在徹底改變GeForce?!秉S仁勛表示。
“機(jī)器人的GPT時(shí)刻即將到來(lái)”
正如黃仁勛拿出超大系統(tǒng)級(jí)晶圓“Grace Blackwell NVL72”Cos美國(guó)隊(duì)長(zhǎng)伸手召喚雷神之錘,又將英偉達(dá)的最新世界模型非常直白地命名為“NVIDIA Cosmos(宇宙)”,發(fā)布完50系列GPU后,他將更多時(shí)間留給了英偉達(dá)的“AI宇宙”。
黃仁勛首先介紹Llama Nemotron系列開(kāi)放式大型語(yǔ)言模型 ( LLM ),這些模型采用LLaMA構(gòu)建,可幫助開(kāi)發(fā)人員在一系列應(yīng)用程序中創(chuàng)建,可幫助開(kāi)發(fā)人員在一系列應(yīng)用程序中創(chuàng)建和部署 AI 代理,包括客戶支持、欺詐檢測(cè)以及產(chǎn)品供應(yīng)鏈和庫(kù)存管理優(yōu)化。
Llama Nemotron模型使用英偉達(dá)的最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行修剪和訓(xùn)練,以增強(qiáng)代理能力,它們擅長(zhǎng)指令遵循、聊天、函數(shù)調(diào)用、編碼和數(shù)學(xué),同時(shí)經(jīng)過(guò)尺寸優(yōu)化,可以在各種英偉達(dá)加速計(jì)算資源上運(yùn)行。
重磅推出的NVIDIA Cosmos,則是一個(gè)旨在理解物理世界的世界基礎(chǔ)模型,黃仁勛稱其效果,“唯有親眼目睹才能真正理解”。
Cosmos 系列大模型從小到大分為:Nano、Super、Ultra三大類,參數(shù)規(guī)模從 40 億到 140 億不等,基于9000萬(wàn)億個(gè)標(biāo)記(Tokens)和2000萬(wàn)小時(shí)真實(shí)世界的人機(jī)交互、環(huán)境、工業(yè)、機(jī)器人及駕駛數(shù)據(jù)訓(xùn)練而成。
據(jù)黃仁勛介紹,Cosmos的核心目標(biāo)并不僅僅是生成創(chuàng)意內(nèi)容,而是讓AI理解物理世界。通過(guò)物理AI,開(kāi)發(fā)者能夠生成合成數(shù)據(jù),訓(xùn)練并優(yōu)化模型,最終實(shí)現(xiàn)機(jī)器人技術(shù)的突破。因此,Cosmos的設(shè)計(jì)優(yōu)先考慮自動(dòng)駕駛和機(jī)器人技術(shù)的獨(dú)特需求,特別是對(duì)真實(shí)世界環(huán)境、照明和物體持久性的高度關(guān)注。同時(shí),Cosmos支持視頻字幕制作和高質(zhì)量字幕生成,可輔助訓(xùn)練多模態(tài)大型語(yǔ)言模型,為未來(lái)的機(jī)器人和AI系統(tǒng)提供強(qiáng)大支持。
按照英偉達(dá)展示的案例,Cosmos已被應(yīng)用于模擬真實(shí)環(huán)境,在工廠車間或駕駛場(chǎng)景中,輸入多模態(tài)內(nèi)容(如文本、圖像、視頻以及機(jī)器人傳感器數(shù)據(jù))可生成基于物理定律的視頻。如今,1X、Agile Robots、Wayve、Uber 等機(jī)器人和汽車公司已在使用Cosmos。
隨后,Cosmos將采用開(kāi)放許可,并在GitHub上開(kāi)源,支持大中小不同規(guī)模的模型,英偉達(dá)希望其像LLaMA3之于企業(yè)AI一樣,推動(dòng)機(jī)器人和工業(yè)AI領(lǐng)域的革命。
黃仁勛還公布了英偉達(dá)在數(shù)字孿生領(lǐng)域的新突破:Mega Omniverse Blueprint,這一框架旨在為數(shù)字孿生環(huán)境中的大規(guī)模物理AI與機(jī)器人隊(duì)列的開(kāi)發(fā)、測(cè)試和優(yōu)化提供支持。
目前,許多先進(jìn)的倉(cāng)庫(kù)和工廠已經(jīng)開(kāi)始使用機(jī)器人與人類協(xié)作。這些機(jī)器人需要在復(fù)雜的傳感器和自主系統(tǒng)的支持下,進(jìn)行高度協(xié)同性的工作。因此,如何在模擬環(huán)境中協(xié)調(diào)訓(xùn)練、優(yōu)化操作流程、保障安全并防止中斷,成為技術(shù)發(fā)展的關(guān)鍵所在。
Mega Omniverse Blueprint的核心目標(biāo)是通過(guò)虛擬模擬和優(yōu)化,在解決方案部署到現(xiàn)實(shí)設(shè)施之前,確保機(jī)器人的工作效率和安全性。在模擬環(huán)境中,機(jī)器人可通過(guò)感知和推理完成任務(wù),規(guī)劃下一步動(dòng)作并執(zhí)行,企業(yè)可以不斷更新其設(shè)施中的機(jī)器人大腦,以實(shí)現(xiàn)智能化的路徑規(guī)劃和任務(wù)分配,從而提升運(yùn)營(yíng)效率。此外,Mega還可精確跟蹤數(shù)字孿生中所有資產(chǎn)的狀態(tài)和位置。
“機(jī)器人技術(shù)的 ChatGPT 時(shí)刻即將到來(lái)?!秉S仁勛表示,“世界基礎(chǔ)模型對(duì)于推動(dòng)機(jī)器人和自動(dòng)駕駛汽車開(kāi)發(fā)至關(guān)重要,但并非所有開(kāi)發(fā)者都具備訓(xùn)練自己世界模型的專業(yè)知識(shí)和資源,我們創(chuàng)建 Cosmos 是為了讓物理 AI 普及化,讓每個(gè)開(kāi)發(fā)者都能用上通用機(jī)器人技術(shù)”。
大小通吃,將超級(jí)計(jì)算機(jī)擺到桌頭
“更大更好”“大力出奇跡的暴力美學(xué)”的Scaling Law,即尺度定律,稱得上AI行業(yè)的大模型第一性原理,意指大模型能力可以通過(guò)算力、參數(shù)和數(shù)據(jù)的堆疊得到大幅提升。
2024年末,圍繞Scaling Law的討論一度熱烈,有觀點(diǎn)認(rèn)為Scaling Law正在逐漸失效,AI模型演進(jìn)速度放緩。
然而,此次演講中,黃仁勛仍堅(jiān)定地表示,大量研究人員和業(yè)內(nèi)人士觀察并證明“Scaling Law仍在持續(xù)發(fā)揮作用”,數(shù)據(jù)越多、模型越大、計(jì)算能力越強(qiáng),模型就越有效。
關(guān)于AI范式的變化,黃仁勛進(jìn)一步指出,Scaling Law的應(yīng)用已從預(yù)訓(xùn)練階段(Pre-training scaling)逐步過(guò)渡到后訓(xùn)練階段(Post-training scaling),如今進(jìn)入測(cè)試階段(Test-time scaling),即增加推理時(shí)間以改進(jìn)模型表現(xiàn)而非僅依靠增加參數(shù)。
Scaling Law也在推動(dòng)著對(duì)英偉達(dá)產(chǎn)品,尤其是Blackwell芯片的巨大需求。被黃仁勛用來(lái)Cos美國(guó)隊(duì)長(zhǎng)的“盾牌”,是一塊Grace Blackwell NVLink72的芯片模型,他透露,英偉達(dá)計(jì)劃造一個(gè)由72塊Blackwell GPU組成的巨型芯片,AI 浮點(diǎn)性能達(dá)到1.4 ExaFLOPS,包括130萬(wàn)億個(gè)晶體管,重量達(dá)1.5噸,60萬(wàn)個(gè)零部件,大約相當(dāng)于20輛汽車,功耗120千瓦,擁有超越世界上最快超級(jí)計(jì)算機(jī)的能力。
黃仁勛說(shuō),這是有史以來(lái)最大的單一芯片,已經(jīng)在全球45家工廠中生產(chǎn),英偉達(dá)會(huì)將部件拆卸并送往各個(gè)數(shù)據(jù)中心重新組裝。
展示完“足夠大”,黃仁勛還展示了“足夠小”。他拿出一款將于今年5月推出的個(gè)人 AI 超級(jí)計(jì)算機(jī)Project Digits,其核心是最新的 GB10 Grace Blackwell Superchip,具有足夠的處理能力來(lái)運(yùn)行復(fù)雜的 AI 模型,同時(shí)又很緊湊,可以放在桌子上并使用標(biāo)準(zhǔn)電源插座供電。這個(gè)產(chǎn)品尺寸類似 Mac Mini,號(hào)稱可處理多達(dá) 2000 億個(gè)參數(shù)的AI模型,起售價(jià)為 3000 美元。
每個(gè) Project Digits 都配備了 128GB 的統(tǒng)一內(nèi)存和高達(dá)4TB的NVMe存儲(chǔ)。對(duì)于要求更高的AI應(yīng)用,兩個(gè)Project Digits可以連接在一起,處理多達(dá) 4050 億個(gè)參數(shù)的模型(Meta 的最佳模型 Llama 3.1 具有 4050 億個(gè)參數(shù))。
用戶可以在Project Digits上本地開(kāi)發(fā)和測(cè)試AI模型,然后使用相同的 Grace Blackwell架構(gòu)和Nvidia AI Enterprise軟件平臺(tái)將其部署到云服務(wù)或數(shù)據(jù)中心基礎(chǔ)設(shè)施。
“人工智能將成為每個(gè)行業(yè)每個(gè)應(yīng)用的主流。通過(guò)Project Digits,Grace Blackwell超級(jí)芯片將惠及數(shù)百萬(wàn)開(kāi)發(fā)者,”黃仁勛表示,“將 AI 超級(jí)計(jì)算機(jī)放在每個(gè)數(shù)據(jù)科學(xué)家、AI 研究人員和學(xué)生的辦公桌上,使他們能夠參與和塑造 AI 時(shí)代”。
排版/ 季嘉穎