文|智東西 程茜
編輯|心緣
智東西10月1日報道,北京時間9點19分,一個全身裸露電線的人形機器人緩緩走上特斯拉AI Day 2022的舞臺,向現(xiàn)場觀眾揮手打招呼。
去年8月,特斯拉CEO馬斯克在第一屆特斯拉AI Day上重磅公布特斯拉首款人形機器人“擎天柱”(Optimus)的概念圖。今年,為了讓人形機器人順利發(fā)布,馬斯克將“特斯拉AI Day”從原定的8月19日推遲了40多天!
今天,“擎天柱”終于從一個身著白衣、頭戴黑面紗的真人扮演者變成了真的機器人,馬斯克的“造人夢”照進了現(xiàn)實。
“我們的目標(biāo)是盡快制造出有用的仿人機器人?!瘪R斯克說,擎天柱將是一種“能力極強的機器人”,產(chǎn)量非常高,最終將生產(chǎn)數(shù)百萬臺,并且預(yù)計成本將遠低于汽車——不到2萬美元。
按其說法,擎天柱最初會從事一些枯燥或危險的工作,比如在特斯拉工廠周圍移動部件,或用扳手給汽車安裝螺栓。按照馬斯克的設(shè)想,未來機器人還可以用于家庭、做飯、修剪草坪和照顧老人,乃至成為人類的“伙伴”或伴侶。
同時馬斯克談道,要完善并證明擎天柱,還有很多工作要做。
他還在活動期間發(fā)推文,透露擎天柱機器人將會有“貓女版”。
01 能澆水、送物、流水線工作6個月推出原型機
完全體的特斯拉人形機器人“擎天柱”體重73kg,用電功率在靜坐時為100W,快走時500W,全身有200多個自由度,手部27個自由度。馬斯克稱,一個人形機器人的成本大概在2萬美元之內(nèi),遠低于一輛汽車。
在現(xiàn)場,馬斯克展示了工程版“擎天柱”,全身裸露天線的“擎天柱”初始版走下臺后,一段視頻中展示了人形機器人的才藝。
在特斯拉工廠內(nèi),“擎天柱”可以搬起印有特斯拉標(biāo)志的箱子,并將其運送到其他地方。
“擎天柱”能夠拿起放在桌子上的水壺,然后行走至辦公室內(nèi)的花草種植區(qū),為花草澆水。其中,渲染的圖片就是機器人的“視角”,看起來除了色彩差異與人類正??吹降膱D像內(nèi)容沒有特別大的區(qū)別。
在工廠里,機器人能將一個長條狀的物體從工作臺拿下來,再整齊排放至裝有相同物體的盒子中。在機器人視角的渲染圖中,它能夠用顏色區(qū)分開現(xiàn)實世界中的不同物體。如它手持的長條形物體是紫色、工作臺是黃色等。
隨后,一臺更像人的“擎天柱”被推上現(xiàn)場,它同樣可以張開雙手或抬起右手,向臺下緩慢打招呼。
真機版本的“擎天柱”因為腳下有支撐裝置,還可以同時抬起雙手雙腳。
不過,與初始版本不同的是,優(yōu)化版“擎天柱”并沒有在現(xiàn)場走動,而是全程由工作人員搬運。
在過去的四個月里,特斯拉的人形機器人就一直在辦公室內(nèi)四處走動。
現(xiàn)階段,特斯拉人形機器人項目從去年2021年AI Day上的概念圖,到今年2月,短短六個月就推出了原型機,現(xiàn)在已經(jīng)有近似完全體的新一代“擎天柱”亮相。
特斯拉第一代機器人從概念、設(shè)計、分析、建立、優(yōu)化、驗證經(jīng)過了反復(fù)驗證,對于這一新物種來說,擁有較低的成本和較高的工作效率也正是驗證這一產(chǎn)品是否能真正推向市場的關(guān)鍵。
02 以汽車設(shè)計過程為基礎(chǔ)優(yōu)化調(diào)參至機器人平臺
擎天柱的設(shè)計是以特斯拉此前積累的車輛設(shè)計過程為基礎(chǔ)。
人類可以吃少量的食物來維持能量,因此為了減少機器人上消耗的能力,特斯拉將人形機器人在空閑時消耗的能量降到最低,只需要按下開關(guān)就可以調(diào)節(jié)其處于低電量或者正常工作的狀態(tài)。
1、電動和控制系統(tǒng):28個驅(qū)動器+2.3kWh的電池組,可工作一整天
從其概念圖中可以看到,整個機器人包含了28個電動驅(qū)動器(橙色)和電池及控制模塊(藍色)。
“擎天柱”身體中間有2.3kWh的電池組,工作電壓為52V,能支持人形機器人工作一整天。這個電池組的獨特之處在于,它把所有的電池電子都集成到了一起,傳感器融合電荷管理等,利用汽車和機能源產(chǎn)品將其融合到一起。這也是特斯拉流線型制造的高效之處。
除技術(shù)外,當(dāng)然也離不開特斯拉強大的基礎(chǔ)設(shè)施和供應(yīng)鏈。
特斯拉機器人使用了單顆特斯拉自研SoC芯片,不同于特斯拉在汽車上使用的雙芯片自動駕駛方案。
與汽車不同,機器人需要處理視覺數(shù)據(jù)做出迅速反應(yīng)、基于多種感官輸入和通訊,因此裝有無線電連接、音頻支持以及需要保護機器人本體和人類的安全特性。
2、基礎(chǔ)結(jié)構(gòu)設(shè)計:量化人體運動軌跡、力度,機器人行動更靈活
特斯拉有能力完成高度復(fù)雜的系統(tǒng)。如人們在駕駛時遇到的突然撞擊,汽車做出相應(yīng)反應(yīng)的過程。因此,為了保護機器人,研發(fā)人員對其結(jié)構(gòu)基礎(chǔ)進行了優(yōu)化,在人形機器人摔倒時不會把變速器和胳膊弄壞,就可以將這一技術(shù)應(yīng)用到機器人之上。畢竟一臺機器人的維修成本很高。
研發(fā)人員采用了與汽車相同的底層技術(shù),讓機器人在所有組件中產(chǎn)生壓力,使得其行走控制變得更加容易,也不會那么僵硬。
以膝蓋為例,人形機器人在設(shè)計時需要仿照人類真實的膝蓋結(jié)構(gòu)。
研發(fā)人員將人類的膝蓋和其運動過程中所受的力線性化,從而學(xué)習(xí)如何讓機器人膝蓋使用更少的力來構(gòu)建,讓其能實現(xiàn)更好的力度控制,并讓相關(guān)結(jié)構(gòu)緊密的包裹在膝蓋周圍。
3、機械驅(qū)動系統(tǒng):解析云端數(shù)據(jù),輕松定制28個驅(qū)動器
汽車和機器人在動力設(shè)計上有很多相似之處,因此,特斯拉在動力設(shè)計上的經(jīng)驗可以應(yīng)用到機器人上。
汽車的驅(qū)動單元是為了讓汽車加速,機器人有28個關(guān)節(jié)驅(qū)動器,和汽車的驅(qū)動器在數(shù)量上相比差異并不明顯,但人形機器人要做的任務(wù)則更為復(fù)雜,它們需要走路或者攀巖,因此研發(fā)人員用模型生成機器人的連接轉(zhuǎn)矩速度軌跡,隨后輸入其優(yōu)化模型來運行。
機器人需要轉(zhuǎn)動,研發(fā)人員根據(jù)扭矩速度軌跡和關(guān)節(jié)驅(qū)動器的效率圖,沿著軌道產(chǎn)生的能源消耗、任務(wù)與時間的累計能量,就可以定義特定執(zhí)行機構(gòu)的樣本,并發(fā)送到云端。這樣一來,就可以縮短其生產(chǎn)成百上千萬關(guān)節(jié)驅(qū)動器的時間。
不過,機器人的每個關(guān)節(jié)都是特定的,28個關(guān)節(jié)都需要定制規(guī)格。因此,研發(fā)人員需要減少定制的執(zhí)行器設(shè)計,解析它們上傳的云并采取共性研究。
“擎天柱”的關(guān)節(jié)驅(qū)動器共有6種,包括三種不同規(guī)格的舵機、三種不同規(guī)格類似重量秤一樣的牽引執(zhí)行器等。
在極限范圍內(nèi)進行測試,其關(guān)節(jié)驅(qū)動器抬起一架半噸重的鋼琴,這也是人形機器人必須具備的功能。
4、手部感知系統(tǒng):大、小形態(tài)均能抓握,手部也能感知物體
人手能以每秒300度的速度移動,擁有成千上萬的觸覺傳感器。特斯拉機械手的設(shè)計靈感就來自于生物學(xué),和人手一樣同樣使用五個手指來驅(qū)動,既可以完成大口徑物體抓取,同時也能滿足抓取精巧物體的需求。
我們周圍世界的工廠被設(shè)計為適于人手抓握的,但也會出現(xiàn)很多我們沒見過的物體。因此,特斯拉的人形機器人手指有6個執(zhí)行器和11個自由度,搭載了能夠驅(qū)動手指并進行感知的傳感器。
手的適應(yīng)機制是非常復(fù)雜的,人類可以認(rèn)識到手在空間中的位置,而這也是其能抓取物體的關(guān)鍵。因此,特斯拉目前也在進行相應(yīng)測試。
5、視覺導(dǎo)航系統(tǒng):采用汽車同款神經(jīng)網(wǎng)絡(luò),自主識別行駛區(qū)域
在機器人的行動方面,“擎天柱”使用特斯拉電動車同樣的神經(jīng)網(wǎng)絡(luò)——“占用網(wǎng)絡(luò)”來識別可行駛區(qū)域,研究人員稱,他們正在研發(fā)如何改善“占用網(wǎng)絡(luò)”,來使得機器人更快、更精準(zhǔn)到達目的地。他們最近在訓(xùn)練人形機器人的計算機視覺識別高頻特征,讓人形機器人能夠快速找到最近的充電站。
研發(fā)人員在模擬測試中,使用自動駕駛模擬器并集成了機器人的運動代碼,在今年四月份,“擎天柱”的移動速度很慢。
研發(fā)人員演示了擎天柱機器人的行動成長軌跡。從2022年4月份邁出第一步,到2022年7月,讓人形機器人解鎖了骨盆的應(yīng)用來保持平衡,2022年8月,讓手臂開始發(fā)揮作用,直到2022年9月,擎天柱的腳趾也派上了用場,可以看出,隨著人形機器人慢慢將更多的關(guān)節(jié)等利用起來并加以訓(xùn)練,它的移動速度有了明顯提升。
6、行動控制系統(tǒng):優(yōu)化調(diào)參從測試映射至現(xiàn)實,解決機器人平衡難題
從人體步行的過程來看,機器人有身體上的自我意識很重要,如能意識到自己四肢的長度是多少、腳有多大,并且如何保持平衡,如何協(xié)調(diào)四肢運動。人類很容易就能做到這些,但對于機器人來說很難。
研發(fā)人員通過運動計劃和控制堆棧,生成機器人運動學(xué)模型,然后將所需路徑生成底層平臺,讓整個系統(tǒng)參考其軌跡進行訓(xùn)練。
機器人模擬系統(tǒng)中按照其期望的路徑規(guī)劃一條線路,不斷添加相互連接的軌跡,然后根據(jù)軌跡規(guī)劃出每個腳的落腳點,然后再讓執(zhí)行器執(zhí)行,以此保證機器人行走過程中的平衡性。
在運動訓(xùn)練中,運動規(guī)劃式是一個理想情形,但實際上將其放到現(xiàn)實世界上是不現(xiàn)實的。在這個過程中缺少幾個關(guān)鍵動作,將其放置到現(xiàn)實世界中,會對模型動力學(xué)造成影響,特別是像兩足動力學(xué)這樣穩(wěn)定的系統(tǒng)。
研發(fā)人員利用相應(yīng)的傳感器以及他們在現(xiàn)實世界中的觀察來解決機器人的控制難題,機器人的骨盆位置、重心位置,使用更好的機器人模型來進行訓(xùn)練。
通過跟蹤機器人在工作室中的路徑來構(gòu)建更好的機器人模型,并依據(jù)實際情況修正機器人的行為。
7、手部控制系統(tǒng):人類模擬視頻映射運動參考,掌握抓握物體位置
為了解決人形機器人在觀察的同時操縱真實的物體世界的難題,研發(fā)人員將這一步驟分成了兩個,首先生成一個自然運動參考系統(tǒng),然后再將其進行優(yōu)化推廣。
假設(shè)有一個人類對某一動作進行了演示,然后研發(fā)人員通過視頻對其動作設(shè)置關(guān)鍵幀,并將其映射到機器人上。這樣只需要一個演示視頻,研發(fā)人員就可以將其推廣到機器人的現(xiàn)實操縱應(yīng)用上。
這就可以解決機器人在抓取物體時手應(yīng)該放在哪里,如何進行搬運放置等難題。
03 人形機器人進階路仍有無限可能
人形機器人這一新物種自誕生起就引發(fā)了熱烈討論,今年已經(jīng)有多家知名科技公司發(fā)布了人形機器人,前有小米“鐵大”,現(xiàn)在特斯拉“擎天柱”在概念版亮相一年后,終于公布了可以走起來的工程版,同時在這次AI Day上,公布了十分完整的技術(shù)路線。
人形機器人因其技術(shù)集成度及難度都很高,被視作AI領(lǐng)域的終極形態(tài),也將成為未來智能機器人的重點發(fā)展方向之一。
現(xiàn)如今,服務(wù)、工業(yè)、特種機器人已經(jīng)深入到社會生活的方方面面,小至家庭中的掃地機器人,大到工廠配送、機械臂等。而人形機器人仍然是一個新鮮事物。
從其技術(shù)難度而言,人形機器人不同于其他機器人形態(tài),代表了人們腦海中機器人的理想形態(tài),其研發(fā)難度也可想而知。
特斯拉作為第一家將其擺上臺面并在控制、步行方面都較為穩(wěn)定的企業(yè),離不開這家公司在自動駕駛領(lǐng)域的多年技術(shù)積累。事實上,自動駕駛技術(shù)中的神經(jīng)網(wǎng)絡(luò)架構(gòu)、AI算法、激光雷達等都可以遷移至人形機器人研究中。
馬斯克在第一屆“AI Day”上曾說過:“我們的汽車是帶輪子的半感知機器人——用神經(jīng)網(wǎng)絡(luò)識別世界,了解如何在世界中導(dǎo)航。”
再加上隨著AI技術(shù)不斷進步,伴隨著人機交互能力加強,其具備的人形相比于其他機器人形態(tài)來說,能夠更好的滿足情感和陪伴需求,這也為人形機器人的發(fā)展帶來了更多可能性。
談及馬斯克研發(fā)人形機器人的初衷,要追溯到四年前。馬斯克認(rèn)為特斯拉的工廠“過度依賴機器人”,并且在很多任務(wù)上,機器人的表現(xiàn)并不如人類。因此,“擎天柱”的初始應(yīng)用場景也被他放到了代替人們從事枯燥、危險性的工作上。
04 結(jié)語:馬斯克讓人形機器人商業(yè)化之路可期
等了一年之久的“擎天柱”,終于出現(xiàn)在了大眾視野中,這也成為特斯拉“AI Day”最受矚目的環(huán)境。不過,其新奇的外觀與性能并不是關(guān)鍵,對于人形機器人而言,其真正量產(chǎn)落地才是衡量這一新物種是否真正有價值的關(guān)鍵。
但從其能澆花、搬東西這些更為細(xì)致的功能來看,馬斯克仍一直堅持著向擬人形態(tài)機器人不斷進階,從手部動作、步態(tài)調(diào)整、控制系統(tǒng)等,依托于特斯拉在汽車領(lǐng)域的強大技術(shù)積累,和基礎(chǔ)設(shè)施及供應(yīng)鏈。再加上馬斯克在人形機器人領(lǐng)域的野心和他強大的行動力,為這一產(chǎn)業(yè)帶來了無限憧憬。
馬斯克在人形機器人亮相后說:“自動駕駛汽車對世界產(chǎn)生的巨大影響,使得運輸生產(chǎn)力提升上至少提高了半個數(shù)量級,未來,擎天柱或許會帶了數(shù)個數(shù)量級的提升?!?/p>
此前曾有爆料稱特斯拉“擎天柱”預(yù)計2023年實現(xiàn)量產(chǎn),計劃在德州工廠部署數(shù)千臺人形機器人,最終可能會擴展到全球數(shù)百萬臺。如果特斯拉的人形機器人能最終量產(chǎn),并真正解決其落地難題,有望促進人形機器人的產(chǎn)業(yè)發(fā)展向前邁進一大步。