精品国产91乱码一区二区三区,亚洲综合色区在线观看,一性一交一伦一片

4月5日，Meta公司發(fā)布了大型語言模型Llama的最新版本Llama 4 Scout與Llama 4 Maverick。

Meta在聲明中表示，Llama 4是一個多模態(tài)AI系統(tǒng)，能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型，并能在不同格式之間實現(xiàn)內(nèi)容轉(zhuǎn)換。據(jù)介紹，Scout和Maverick是該公司首款采用混合專家架構(gòu)(MoE)的模型，兩者均以開源形式發(fā)布。此外，Meta還預(yù)告了Llama 4 Behemoth，稱其為“全球最聰明的語言模型之一，將作為未來模型訓(xùn)練的教師模型”。

沒想到，隨后就被曝出模型訓(xùn)練測試集作弊，內(nèi)部員工直接辭職，引發(fā)爭議。

爭議的導(dǎo)火索源于海外留學(xué)求職交流論壇“一畝三分地”的一篇帖子，發(fā)帖人自稱是參與Llama 4訓(xùn)練的內(nèi)部員工，并表示已因此辭職。

該員工透露，盡管團隊反復(fù)努力訓(xùn)練，Llama 4的內(nèi)部模型性能始終無法達到開源SOTA（State-of-the-Art，頂尖水平）基準，差距明顯。為達成目標，公司領(lǐng)導(dǎo)層提出在訓(xùn)練后期將各種基準測試的“測試集”數(shù)據(jù)混入訓(xùn)練或微調(diào)數(shù)據(jù)中，以此在各項指標上達成目標，交出一份“好看”的成績單。

這位內(nèi)部員工@dliudliu表示，自己無法接受這種做法，甚至辭職信中明確要求不要在Llama 4技術(shù)報告中掛名。

就在Llama 4即將發(fā)布前幾天，Meta AI研究主管Joelle Pineau在工作8年之后突然宣布離職。

知名科技媒體TechCrunch也發(fā)文質(zhì)疑Llama 4的性能測試存在誤導(dǎo)性。文章聚焦Llama 4（即Maverick）在著名的人類評估排行榜LM Arena上的表現(xiàn)，指出Maverick雖取得第二名的好成績，但背后另有隱情。在一些實測中，號稱千萬上下文的召回率，上下文的實際表現(xiàn)，遠低于預(yù)期。而Llama 4 Maverick 在 aider 多語言編碼基準測試中得分為實測僅為 16%。

有人認為Llama 4的表現(xiàn)甚至和Llama 3.2一樣沒有任何進步，也無法完成寫詩。其他用戶在測試后也表達了同樣的觀點，Llama 4有點不符合預(yù)期。

幾位AI研究人員在社交媒體上都“吐槽”認為，Meta提交給LM Arena進行測試評估的Maverick版本，和公開發(fā)布給開發(fā)者使用的版本可能并非同一個。

不過Meta表示，更強大的一款被命名為Llama 4 Behemoth的大模型仍在訓(xùn)練中。據(jù)稱，Meta Platforms的CEO扎克伯格此前給全員下了死命令，4月底是Llama 4交付最后期限。

早在1月10日，有媒體稱，據(jù)加利福尼亞聯(lián)邦法院公開的庭審文件中，一些作家指控Meta Platforms在訓(xùn)練其Llama AI模型時，未經(jīng)授權(quán)使用了盜版電子書和文章數(shù)據(jù)集LibGen，并通過點對點（P2P）方式下載了大量盜版書籍和文章，而且內(nèi)部員工還爆料此事獲得了扎克伯格的允許，目前案件在審理中。

今年年初，扎克伯格曾表示2025年計劃投資多達650億美元用于人工智能（AI）相關(guān)項目，包括建立新的巨型數(shù)據(jù)中心和加大AI團隊的招聘，以鞏固其在與OpenAI和谷歌競爭中的地位。

4月5日，Meta公司發(fā)布了大型語言模型Llama的最新版本Llama 4 Scout與Llama 4 Maverick。

沒想到，隨后就被曝出模型訓(xùn)練測試集作弊，內(nèi)部員工直接辭職，引發(fā)爭議。

這位內(nèi)部員工@dliudliu表示，自己無法接受這種做法，甚至辭職信中明確要求不要在Llama 4技術(shù)報告中掛名。

就在Llama 4即將發(fā)布前幾天，Meta AI研究主管Joelle Pineau在工作8年之后突然宣布離職。

有人認為Llama 4的表現(xiàn)甚至和Llama 3.2一樣沒有任何進步，也無法完成寫詩。其他用戶在測試后也表達了同樣的觀點，Llama 4有點不符合預(yù)期。

幾位AI研究人員在社交媒體上都“吐槽”認為，Meta提交給LM Arena進行測試評估的Maverick版本，和公開發(fā)布給開發(fā)者使用的版本可能并非同一個。

歷史搜索全部刪除

熱門搜索

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮

馬克?扎克伯格

評論

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮

馬克?扎克伯格

評論

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮

Llama 4被曝訓(xùn)練作弊，發(fā)布后實測差評如潮