人形機器人迎來了新奇:特斯拉“畫餅”,波士頓“賺眼淚”
波士頓“賺眼淚”的特斯拉“畫餅”,多顆“重磅炸彈”再次點燃了人形機器人行業(yè)。
四月二十三日,特斯拉CEO馬斯克在財務(wù)報告電話會議上表示,今年年底,Optimus人形機器人將有能力完成簡單的工廠任務(wù),并有可能在2025年實現(xiàn)對外銷售。
4月17日,波士頓動力在網(wǎng)上發(fā)布了一段視頻。曾經(jīng)表演過跳躍、后空翻、空手道等操作的液壓人形機器人Atlas。,揮舞著上下手臂,向觀眾獻上“最后一舞”,然后鞠躬離開,字母緩緩出現(xiàn)。“Til we meet again, Atlas.(下一次再見,阿特拉斯)”,可謂賺足了觀眾的眼淚。
在觀眾感動不到24小時后,波士頓動力立即發(fā)布了新版本的人形機器人預(yù)告,其名稱也叫Atlas。新機器人不僅可以實現(xiàn)180?!泐^部轉(zhuǎn)動、360°關(guān)節(jié)扭動,動力方面也采用全電驅(qū)動。震驚四座之后,讓人們看到“具身智能”的發(fā)展迎來了新奇。
在ITFWorld上,英偉達創(chuàng)始人黃仁勛 在2023年半導(dǎo)體會議上,AI的下一波浪潮將是“全身智能”,它描述的“全身人工智能”是一個可以理解、推理和與物理世界互動的智能系統(tǒng),包括機器人技術(shù)、無人駕駛汽車甚至聊天機器人。它會更聰明,因為智能系統(tǒng)已經(jīng)開始了解物理世界,而不是簡單地操作命令。
從“模仿人”到“超越人”
波士頓動力預(yù)告視頻開頭,Atlas靜靜地躺在地上,伴隨著嗡嗡作響的電機聲,它的腿從一個不可思議的角度向上旋轉(zhuǎn)折疊,然后支撐著整個身體。完全站立后,Atlas原本背對著鏡頭,先把頭轉(zhuǎn)了180?!?,當你慢慢走向鏡頭時,你的上半身轉(zhuǎn)動了180?!悖冃谓饎傋冃螘r頗有一種感覺。
短短半分鐘的視頻,震驚了不少人,英偉達高級研究總監(jiān),具身智能負責(zé)人Jim Fan甚至發(fā)帖感嘆:我們?nèi)绱税V迷于“人類水平”的機器人技術(shù),以至于忘記了這只是人為的限制。為什么我們不從一開始就創(chuàng)造一個超越人類的新物種?
“360°關(guān)節(jié)活動是機器人給我?guī)淼淖钪庇^的震撼,在很大程度上突破了傳統(tǒng)關(guān)節(jié)的運動限制。高科技機器人產(chǎn)業(yè)研究所的優(yōu)勢盧瀚宸告訴《IT時報》記者,傳統(tǒng)人形機器人的關(guān)節(jié)活動視角將盡可能模仿身體關(guān)節(jié)活動的設(shè)計范圍,例如頸部旋轉(zhuǎn)80°~90°,髖關(guān)節(jié)活動視角為120°~150°。
移動視角越大,機器人的靈活性就越高,而增加靈活性最直接的方法就是增加關(guān)節(jié)執(zhí)行器的數(shù)量。以特斯拉Optimus為例。全身有28個執(zhí)行器,包括6個肩膀、2個肘部、6個手腕、2個身體、6個髖骨、2個腿和4個腳踝,包括14個旋轉(zhuǎn)執(zhí)行器和14個線性執(zhí)行器。在現(xiàn)有的人形機器人中,如此多的執(zhí)行器數(shù)量可以算是“遙遙領(lǐng)先”。
然而,Optimus就像一個步履蹣跚的老人,與全球仿生機器人“天花板”波士頓動力創(chuàng)造的Atlas相比。
雖然波士頓動力還沒有公開新版本的Atlas執(zhí)行器數(shù)量,但CEO羅伯特·普萊特表示,新版本的Atlas之所以能夠達到這樣的靈活性,是因為在大多數(shù)關(guān)節(jié)處設(shè)計了一套定制的大功率、極其靈活的執(zhí)行器,將頂級玩家般的力量集成在關(guān)節(jié)處的小型機器中。這樣,即使在狹小的空間里,也可以靈活轉(zhuǎn)身,可用的場景變得更加普遍。
如果波士頓動力能量產(chǎn)這種“敏捷身體”,再加上多模式大模式賦予的“超腦”,可能會成為“治愈”人工智能笨拙的“良藥”。
要商業(yè)化,首先要進行電氣化。
電力作為第二次工業(yè)革命的核心特征,在第四次科技革命中仍然扮演著動力源的角色。波士頓動力之前一直在深度培育液壓動力?!安⒉皇钦f液壓路線‘低人一等’。液壓技術(shù)路線在高爆發(fā)、高負荷等情況下仍有很強優(yōu)勢。但綜合考慮光、機、電、計算、軟等技術(shù),加上成本衡量,純電驅(qū)動是目前多場景領(lǐng)域最好的機器人路線選擇。?!北R瀚宸說。
在波士頓動力發(fā)布的液壓Atlas演示視頻中,經(jīng)常可以看到機器人在做跳躍、后空翻等高難度動作失誤時會從關(guān)節(jié)噴出腿部液壓油,很多網(wǎng)友嘲諷機器人皮套中的演員受傷。
“在成本、高精度控制、后期維護、噪聲等方面,電驅(qū)具有很大的優(yōu)勢。宇樹科技市場部負責(zé)人王其鑫告訴《IT時報》記者,在成本方面,單臺液壓Atlas的成本為200萬美元。相比之下,宇樹最新發(fā)布的雙足機器人H1成本已經(jīng)降至幾十萬元。
根據(jù)高盛發(fā)布的《人形機器人專題報告》,2022年高端機器人材料成本從25萬美元降至2023年15萬美元,降幅達到40%。而且,電驅(qū)機器人的成本還有下降的空間。
在高精度控制方面,為了模仿人類行走、抓取等復(fù)雜行為,人形機器人的每一個關(guān)節(jié)都需要精確的運動控制。與液壓系統(tǒng)相比,電力驅(qū)動系統(tǒng),尤其是伺服電機,可以提供非常高的位置、速度和扭矩控制精度,對于模擬人體的認知能力尤為重要。另外,電驅(qū)動系統(tǒng)和機械控制系統(tǒng)更容易集成,便于通過軟件編程設(shè)計和更新復(fù)雜的動作序列,系統(tǒng)故障更容易診斷和維護。
在暴發(fā)力不足的情況下,電驅(qū)技術(shù)也取得了進步。一個月前,宇樹科技發(fā)布了世界上第一個全尺寸電動驅(qū)動人形機器人原地空翻的視頻,其動作流暢度和平衡度不再輸給液壓Atlas。王其鑫說,這項技術(shù)是在人形機器人的每個關(guān)節(jié)上安裝了19個核心關(guān)節(jié)電機,其中胯部最大扭矩可達360牛頓米,最大拉力可達1000牛。但是上述機器人目前還處于初期測試階段,應(yīng)用場景多以實驗為主。
隨著液壓Atlas的退役,電動驅(qū)動Atlas的新生也從側(cè)面證實了波士頓動力乘勢而上的電動驅(qū)動技術(shù)。商業(yè)前景和“錢景”吸引了這位大廳級玩家。以成功商業(yè)化的亞馬遜雙足機器人Digit為例。目前的運營成本是每小時10到12美元,但亞馬遜預(yù)測,隨著產(chǎn)量的增加,成本會降低到每小時2到3美元,遠低于人工成本,需求只會增加。
根據(jù)高盛的預(yù)測,2025年、2030年、2035年,人形機器人全球市場總規(guī)模將分別達到15億美元、120億美元、380億美元,出貨量分別為2萬、25.6萬、137.8萬臺。
羅伯特·普萊特說,實現(xiàn)全面量產(chǎn)需要幾年時間。2025年,計劃在現(xiàn)代汽車場景中測試電驅(qū)動Atlas。只有了解使用場景,投資機器人才能帶來足夠的生產(chǎn)力。
急需運動控制大模型
在人形機器人領(lǐng)域,應(yīng)用于不同領(lǐng)域的機器人將被分類,例如機器人創(chuàng)業(yè)公司Figure與OpenAI合作打造的Figure。 01,這種人形機器人,可以與人類對話,清理垃圾,整理餐具,將可食用的物品帶給演示者,主要使用視覺感知模型。
他說:“對我們和波士頓動力以大規(guī)模靈活運動為主的機器人來說,更需要的是一種基于運動控制類的垂類大模型。“王其鑫告訴《IT時報》記者,目前,在機器人測試訓(xùn)練中,AI模型往往扮演一個模擬器的角色。通過計算機上的虛擬場景和機器人模型,數(shù)值模擬遇到障礙物時需要做出哪些動作指令,然后將其形成的經(jīng)驗存儲在實體機器人上,并不斷調(diào)整。
然而,目前大多數(shù)大型制造商都在“卷”交互、生成、視覺,機器人運動領(lǐng)域仍然存在一片空白。如果搭載運動控制大模型,就不需要計算機場景模擬,而是成為現(xiàn)實障礙物的自動學(xué)習(xí)計算,可以準確識別運動軌跡、力量控制、速度控制、平衡控制等。,從而快速提高機器人的運動能力。
本文來自微信微信官方賬號“IT時報”(ID:vittimes),作家:沈毅斌,編輯:錢立富 36氪被授權(quán)發(fā)布的孫妍。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com