字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)開源一項(xiàng)MoE架構(gòu)優(yōu)化技術(shù)

字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)近日開源一項(xiàng)名為COMET的MoE架構(gòu)優(yōu)化技術(shù),可將大模型訓(xùn)練效率提升1.7倍。論文顯示,該技術(shù)已實(shí)際應(yīng)用于字節(jié)的萬卡集群訓(xùn)練,實(shí)現(xiàn)數(shù)百萬GPU小時(shí)訓(xùn)練算力的節(jié)省。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

字節(jié)跳動(dòng)

5k
  • 字節(jié)啟動(dòng)Top Seed大模型頂尖人才計(jì)劃2026屆校招
  • 字節(jié)AI產(chǎn)品據(jù)悉調(diào)整:貓箱負(fù)責(zé)人離職,星繪并入豆包

評論

暫無評論哦,快來評價(jià)一下吧!