2024年,當越來越多的企業(yè)從趕大模型的潮流與炫大模型的參數(shù)規(guī)模開始轉(zhuǎn)移到行業(yè)落地時,華為攜生態(tài)伙伴用大模型深耕行業(yè)的成果儼然遍地開花。
在9月19日華為全聯(lián)接大會2024大會上同期舉辦的華為云AI用戶峰會上,華為云為28個創(chuàng)新項目頒發(fā)了“AI先鋒獎”,涵蓋了包括醫(yī)療、教育、交通、物流、鋼鐵、礦山、汽車、環(huán)保、政務、金融、運營商等16個重點行業(yè)。
在面對大模型熱潮,能夠有這么多行業(yè)企業(yè)與政府組織靜下心來,抵住誘惑,戰(zhàn)勝各種困難,找到大模型應用的真正價值,實屬不易。眾所周知,應用大模型的成本高投入大,如何將有限的資源投入到真正能夠產(chǎn)生價值的地方中,就顯得非常關鍵。
不過,正如華為云大數(shù)據(jù)與人工智能領域總裁尤鵬所說,從實踐中來到實踐中去,共同探索才能走出企業(yè)智能化的蛻變之路。
大模型不應局限“對話框”,已深入千行萬業(yè)
發(fā)展新質(zhì)生產(chǎn)力實現(xiàn)產(chǎn)業(yè)升級并且推動高質(zhì)量發(fā)展是國家的戰(zhàn)略。大模型技術(shù)作為新質(zhì)生產(chǎn)力的典型代表,為企業(yè)賦能是根本。但是,對于企業(yè)而言,需求復雜且多樣,大模型訓練與微調(diào)既需要強大算力,又要有眾多的企業(yè)數(shù)據(jù)與行業(yè)知識等,因此,大模型的應用不應該局限于“對話框”這種相對單一的模式, 而是要面向產(chǎn)業(yè),尤其是重點行業(yè),挖掘需求痛點,為產(chǎn)業(yè)創(chuàng)造價值。
在傳統(tǒng)行業(yè)中,能源是一個大行業(yè),中國礦產(chǎn)資源豐富,如果能夠利用大模型技術(shù)提升生產(chǎn)效率,既能產(chǎn)生巨大的經(jīng)濟效益,又保證了生產(chǎn)的安全,意義重大。
山東能源集團作為行業(yè)領軍企業(yè),其旗下云鼎科技依托華為公司盤古大模型建設了集團人工智能訓練中心,探索和發(fā)掘煤礦生產(chǎn)領域的采、掘、機、 運、通、洗選等全場景的人工智能應用。在洗選煤和配煤場景中,由于相關生產(chǎn)的工藝數(shù)據(jù)輸入因素關系復雜,無法完全憑人工經(jīng)驗來確定。項目團隊就利用山東能源廠礦的實際數(shù)據(jù)進行建模,協(xié)助解決相關參數(shù)準確預測和控制的問題,在新模型中應用效果產(chǎn)生了明顯改變。以焦化配煤優(yōu)化場景為例,項目團隊利用圖網(wǎng)絡技術(shù)訓練配煤優(yōu)化模型,經(jīng)過訓練,不但配比更精準,而且提高了配比輸出效率,將人工耗時從1-2天縮短到分鐘級,大大提高了生產(chǎn)效率。再以安全巡檢場景為例,通過盤古礦山大模型和AI應用的視覺識別能力,使得在惡劣作業(yè)環(huán)境下每天巡檢改為每周巡檢一次,節(jié)省人力的同時,還減少了安全事故率。而且,山東能源集團在實現(xiàn)這些場景應用后,不但將其復制到集團其他礦井廠區(qū),也開始為其他能源礦山企業(yè)提供服務,真正實現(xiàn)內(nèi)部規(guī)模復制,內(nèi)生外化向外輸出。
中國電子商務快速發(fā)展,出海與全球化成為眾多企業(yè)的新藍海,物流已經(jīng)成為中國國民經(jīng)濟的基礎設施之一。?據(jù)相關數(shù)據(jù)顯示,在2023年全國社會物流總額達到352.4萬億元?,具體到2024年1至7月份的數(shù)據(jù),全國社會物流總額為197.7萬億元。面對如此規(guī)模,即使效率提升幾個百分點,對整個社會與企業(yè)產(chǎn)生的價值也是巨大的。
順豐作為物流行業(yè)的龍頭企業(yè),借助華為昇騰AI云服務,利用物流行業(yè)知識及物流供應鏈的數(shù)據(jù),構(gòu)建了自己的豐語大語言模型,經(jīng)過預訓練、監(jiān)督微調(diào)以及基于人工反饋的強化學習后,將大模型滲透到順豐物流的員工服務、客戶服務、物流下單、物流審單以及清關等眾多環(huán)節(jié)中。在客服工作臺,實時獲取和反饋物流信息是保障服務效率的關鍵,在豐語大模型的幫助下,通過優(yōu)化信息抽取功能,使實時物流信息抽取錯誤率降低了52%;在國際物流中配送,針對不同國家對收寄物品有不同的標準和要求,借助豐語大模型改進對物品名稱的改寫功能,使收寄物品名改寫錯誤率降低了42%。這些看似微小的變化,放到在巨大的產(chǎn)業(yè)產(chǎn)值面前,就是巨大的經(jīng)濟效率。
其實,不只是能源礦山和物流行業(yè),中國產(chǎn)業(yè)門類齊全,產(chǎn)業(yè)鏈條完善,擁有全面的各種類型的海量數(shù)據(jù),這就要在千行萬業(yè)中找到機會,全面推進大模型創(chuàng)新與深度賦能。
據(jù)華為公司副總裁、華為云中國區(qū)總裁張修征介紹,華為已經(jīng)攜手客戶、伙伴將盤古大模型落地到了醫(yī)療、電力、氣象等30多個行業(yè),400多個模型應用場景,為各行各業(yè)的生產(chǎn)場景“解難題、做難事”,為各行各業(yè)的客戶帶來實際的經(jīng)濟效益和生產(chǎn)價值。
人工智能行業(yè)發(fā)展之難,技術(shù)場景應用是關鍵
將大模型與行業(yè)深度融合,不同行業(yè)有不同的需求,而且涉及到企業(yè)的研發(fā)、營銷、生產(chǎn)、制造、供應鏈、經(jīng)營與管理等眾多環(huán)節(jié),每個環(huán)節(jié)的業(yè)務場景對模型的精度要求也不同。要找到合適的技術(shù)應用場景成為關鍵,需要產(chǎn)業(yè)中的技術(shù)服務商與愿意探索創(chuàng)新的先鋒客戶共同努力。
天士力作為中國生物醫(yī)藥的領先創(chuàng)新企業(yè),在華為云盤古NLP大模型和盤古藥物分子大模型的基礎上,學習訓練了4000多萬篇文獻、1000多本古籍等中醫(yī)藥數(shù)據(jù),從古方古籍和現(xiàn)代文獻中總結(jié)出知識和經(jīng)驗,開發(fā)出了中醫(yī)藥語言大模型和計算大模型“數(shù)智本草”。并且,在盤古17億化合物的藥物分子大模型基礎上,增訓了350萬天然產(chǎn)物分子數(shù)據(jù),首次構(gòu)建了中藥材天然產(chǎn)物分子計算大模型,基于數(shù)智本草平臺快速精準的文本挖掘算法、整合的疾病基因和藥物靶點信息,系統(tǒng)詮釋了多個復方中成藥的作用機制,有望更好地優(yōu)化方劑和發(fā)現(xiàn)新藥,提升中醫(yī)藥研發(fā)創(chuàng)新效率。同時,還將中醫(yī)名醫(yī)專家經(jīng)驗的數(shù)據(jù)整理,對大模型進行微調(diào),構(gòu)建了名醫(yī)輔助診療開方模型,進而實現(xiàn)名醫(yī)經(jīng)驗的傳承。
高鐵網(wǎng)絡作為我國交通的大動脈,截至2023年底,其運營里程已經(jīng)達到4.5萬公里,確保安全運營的日常運維成為一項非常重要的工作。當前已投入數(shù)萬人從事故障檢測識別工作,但是,由于勞動強度高,導致人員流動大、檢修質(zhì)量難保證,而且成本極高。
因此,北京鐵道工程機電技術(shù)研究所股份有限公司將華為云盤古鐵路大模型應用在北鐵所巡檢機器人動車一級修項目上,以便改變檢修方式。不過,對于這個場景的數(shù)據(jù),由于這些故障很多都拍攝成了圖片,要識別故障,就要采用多模態(tài)融合診斷技術(shù)對采集到的多模態(tài)數(shù)據(jù)進行學習。并且要將行業(yè)know how轉(zhuǎn)換為車輛故障標準定義、車輛圖像樣本標注數(shù)據(jù),才進行訓練學習。同時,對于圖像重構(gòu)算法則利用圖像分割、擦除、生成、融合等方式,還要盡可能構(gòu)造出多種罕見的故障形態(tài),以解決罕見故障的識別難題。這樣,才能在隨后在推理過程中,采用圖片+3D point cloud+laser spectrum的MFD解碼技術(shù)和多維度空間特征對齊算法,對故障進行多模態(tài)診斷。
另外,項目開發(fā)周期也是一個考驗。為了推運進度,結(jié)合華為開放的盤古CV大模型工作流和華為的技術(shù)支持服務,自行進行算法開發(fā),算法精準度提升了5%到20%,開發(fā)周期減少50%。正式上線后,目前,動車一級修項目已經(jīng)能夠覆蓋8大類型、350多種故障,故障識別準確率大幅提高,在多個細分場景實現(xiàn)了98%以上的準確率成績,而且具有識別的故障“全”,“準”的特點。
可以看到,在這些新場景上的創(chuàng)新,反映出大模型創(chuàng)新不是一家企業(yè)的創(chuàng)新,每個場景都有其所在領域獨特的需求和挑戰(zhàn),需要定制化的AI解決方案,是集眾智的創(chuàng)新,包括完善能夠聚集各行各業(yè)的專家和資源的生態(tài)系統(tǒng)。這種場景創(chuàng)新不但為企業(yè)創(chuàng)造了巨大價值,而且?guī)砹诵袠I(yè)的變革,意義得大。因此,要為人工智能時代呼喚更多的先鋒,才能將更多場景打造出來,真正推動大模型的應用。
持續(xù)完善AI基礎設施能力,創(chuàng)造無限可能的價值
其實,以大模型為代表的人工智能不只是一項技術(shù),它更是推動經(jīng)濟發(fā)展的重要引擎。IDC在9月18日發(fā)布的《人工智能對經(jīng)濟和就業(yè)的全球影響》的新研究預測中提到,到2030年,采用人工智能、在現(xiàn)有業(yè)務運營中使用人工智能以及為企業(yè)和消費者客戶提供更好的產(chǎn)品/服務的商業(yè)支出將帶來19.9萬億美元的產(chǎn)值,并且在2030年推動全球GDP的 3.5%。
因此,要搶占人工智能全球制高點,除了尋找創(chuàng)新場景,還要解決算力、數(shù)據(jù)、行業(yè)等諸多基礎難題。中國信息通信研究院人工智能研究所所長魏凱認為,大模型工程實踐復雜,需要有系統(tǒng)落地路線圖作為參考,尤其是硬實力建設,在基礎設施層面,要有算力、數(shù)據(jù)、平臺,模型服務架構(gòu)以及模型應用生態(tài),才能系統(tǒng)推動大模型快速在行業(yè)落地。
目前,華為云作為國內(nèi)唯一擁有AI端到端的全棧能力的服務商,擁有包括昇騰云服務、盤古大模型、大模型應用一站式開發(fā)平臺ModelArts、數(shù)據(jù)開發(fā)與治理平臺DataArts等。
其中,華為昇騰AI云服務已全面適配行業(yè)主流的100多個開源大模型,可以為百模千態(tài)的發(fā)展提供了強勁動力。而且,在芯端算力上云方面,華為將端側(cè)的AI算力需求通過光纖和無線網(wǎng)絡釋放到云上,可以讓客戶通過端云協(xié)同獲得無縫的AI算力。
最新發(fā)布的華為盤古大模型版本,是包含了不同參數(shù)規(guī)格的模型,可以支持不同的業(yè)務場景。同時支持文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)的識別,具備了精準理解物理世界的能力。華為云ModelArts作為云上一站式AI開發(fā)平臺,為企業(yè)提供數(shù)據(jù)處理、算法開發(fā)、模型訓練、模型管理、模型部署等AI應用開發(fā)全流程技術(shù)能力,能夠讓AI應用開發(fā)更快捷、落地更簡單。
另外,華為還將構(gòu)建企業(yè)大模型應用場景的經(jīng)驗總結(jié)成最佳實踐方法論,從場景調(diào)研分析、方案設計、算法開發(fā)、應用開發(fā)、交付服務、常態(tài)化使用以及復制推廣等,涵蓋了讓AI應用起來的全生命周期環(huán)節(jié)。
相信,在以華為為代表的產(chǎn)業(yè)界努力下,做好中國大模型百花園的黑土地,將大模型引入更多行業(yè)場景中,在政府、企業(yè)、產(chǎn)學研等多方共同協(xié)作下,AI+行業(yè)必將迎來新的百花齊放的增長拐點。