機器人一定要“像人”嗎?王興興也擺頭
王興興認為,隨著通用人工智能,(AGI)或者隨著通用AI的發(fā)展,機器人形式會變得更加多樣化。未來工廠、醫(yī)療等方面的機器人形式會比現(xiàn)在更加豐富,甚至可能會增加100倍。
六月六日,宇樹機器人G1在2025北京智源大會具體智能會客室階段、天工機器人,銀河通用機器人蓋博特(Galbot)各展特技,共同演繹人形機器人的技術(shù)突破。
我看到G1一套流暢的格斗動作吸引了整個觀眾的注意力。它的勾拳、抬腿、躲閃等操作吸引了觀眾的掌聲。與此同時,人形機器人也展示了更多的實用技能,如選擇早餐水果、協(xié)助購物、疊衣服、制作三明治等。,這顯示了他們在日常生活中的多樣化應(yīng)用領(lǐng)域。
人形機器人無疑是目前最受歡迎的熱點之一。然而,一個問題縈繞在每個人的腦海中:這些多才多藝的人形機器人什么時候才能真正結(jié)束工作,成為促進社會發(fā)展的“生產(chǎn)力責任”?
北京人形機器人創(chuàng)新中心總經(jīng)理熊友軍、北京大學助理教授、智源智能研究中心主任、銀河通用創(chuàng)始人兼CTO王鶴、穹徹智能創(chuàng)始人、上海交通大學教授盧策吾、宇樹科技CEO王興興、北京人形機器人創(chuàng)新中心總經(jīng)理熊友軍。Physical Intelligence聯(lián)合創(chuàng)始人兼CEO Karol Hausman討論了人形機器人競賽、工業(yè)化和技能落地、VLA模型應(yīng)用和挑戰(zhàn)等。
風險投資日報記者李明明攝攝
未來機器人的形態(tài)將是千奇百怪的
機器人必須在具體智能的大潮中,造成人形似乎是一種常見的做法,但是機器人必須做成人形嗎?
對于這一點,王興興表示,他過去多次公開強調(diào),機器人不得不采用人形設(shè)計。對于其企業(yè)而言,機器狗和人形機器人的研發(fā)是自然選擇。特別是在腿部設(shè)計上,選擇輪試底盤是一個很好的方案。目前,人形機器人之所以受到青睞,尤其是它的上半身保持類似于人類的形狀,根本原因是目前的人工智能技術(shù)是基于人類數(shù)據(jù)進行收集和訓練的。人形機器人的上身動作與人類一致,使數(shù)據(jù)收集更加方便,同時也方便AI練習。例如,在舞蹈或格斗比賽中,如果機器人的外形與人類不符,就不能完成相關(guān)的動作。
王興興認為,隨著通用人工智能,(AGI)或者隨著通用AI的發(fā)展,機器人形式會變得更加多樣化。未來工廠、醫(yī)療等方面的機器人形式會比現(xiàn)在更加豐富,甚至可能會增加100倍。
熊友軍同意王興興的觀點,認為具體智能的發(fā)展方式是多樣化的,不應(yīng)局限于人類。人形機器人是一種重要的具體智能研究媒介,但主要是基于未來市場需求的考慮。目前,機器人可采用四足或輪式機器人等非人形設(shè)計,這是不可或缺的。然而,從市場應(yīng)用的角度來看,人形機器人在生活、商業(yè)和日常生活中有著更廣闊的應(yīng)用前景,而工廠應(yīng)用領(lǐng)域只是其中的一小部分。熊友軍認為,人形機器人的市場容量將遠遠超過其它類型的機器人。
第二,從人機交互的角度來看,未來人形機器人將更加自然地融入家庭和生活,甚至成為人類的朋友或伴侶。所以,人形機器人在人機交互方面具有明顯的優(yōu)勢,更容易被大家接受。另外,目前的環(huán)境大多是為人類設(shè)計的,人形機器人能更方便地適應(yīng)這些環(huán)境,并且使用現(xiàn)有的工具,不需要過多的改造。否則,為了安排機器人,環(huán)境可能需要大規(guī)模改造。
綜上所述,熊友軍堅信,從長遠來看,雖然目前其成本和技術(shù)仍面臨一些挑戰(zhàn),但人形機器人是一種合適的載體選擇。
VLA模型仍然存在局限性
VLA是一種有前途的方法,最近被提出為一種可泛化的機器人控制。王鶴指出,自動駕駛領(lǐng)域已經(jīng)驗證了端到端戰(zhàn)略的優(yōu)勢。VLA模型的核心優(yōu)勢在于可以直接從視覺觀察和自然語言指令中導出動作,無需中間產(chǎn)品。然而,VLA仍處于發(fā)展階段。它需要突破的方向不是簡單地將人類的所有能力集成到一個底座模型中,而是逐漸將力覺、觸覺、嗅覺、味覺和聽覺等多種模式信息結(jié)合起來,從而實現(xiàn)更貼近人類水平的具體智能。
王鶴認為,目前VLA最適合移動抓取和放置任務(wù)。這些任務(wù)主要依靠視覺,輔以觸感或力覺傳感器,具有廣闊的應(yīng)用前景。如果VLA能夠在工業(yè)、商業(yè)、服務(wù)等場景下成功部署,就意味著智能技術(shù)真正走向產(chǎn)品化。
盧策吾強調(diào)了VLA模型的本質(zhì)意義,即通過視覺理解世界,通過語言與人類交流,通過行動改變命運。他認為語言是連接不同語義數(shù)據(jù)的“粘合劑”,VLA的可擴展性雖然強大,但仍然有局限性。智能化的發(fā)展需要逐漸落地,同時也需要長期目標,即促進通用智能化的發(fā)展。
盧策吾指出,VLA面臨的問題在于如何在一般情況下壓縮不確定性,這需要不斷添加力反饋和物理世界理解等新的模式信息,以增強模型的魯棒性和適應(yīng)性。通過力反饋技術(shù),他提到可以顯著提高機器人運動的穩(wěn)定性,減輕計算負擔。另外,通過模擬生成數(shù)據(jù)和數(shù)字基因技術(shù),可以進一步壓縮模型空間,減少數(shù)據(jù)需求,從而促進VLA逐漸走向通用智能。
Karol 在討論中,Hausman指出,跨自身VLA在實踐中仍然面臨瓶頸。主要問題是目前的模型不能完全滿足要求,需要進一步完善算法和引入新技術(shù)。雖然數(shù)據(jù)規(guī)模巨大,但算法在處理這些數(shù)據(jù)方面仍然存在不足。他認為,目前的重點是優(yōu)化算法,而不是單純依靠數(shù)據(jù)規(guī)模的擴大。
人形機器人比賽是觀察特征的起點。
王興興表示,從春晚到格斗比賽,技術(shù)實力得到了很好的展示,并且讓大家了解了當前機器人的發(fā)展階段。但是宇樹最終的目標是真誠地希望機器人能夠工作,不管是家庭還是工廠。但愿機器人能夠真正釋放人類的生產(chǎn)力。但是在最終目標沒有實現(xiàn)之前,先參加一些表演和格斗比賽,給大家展示一下機器人的狀況,產(chǎn)生一些商業(yè)價值。上半年,包括人形機器人在內(nèi)的租賃市場也比較火爆,本身就帶來了一些工業(yè)價值。
熊友軍說舉辦機器人比賽是有意義的。首先,比賽可以為公眾普及機器人的發(fā)展。比如將在鳥巢舉辦的比賽會有短跑、長跑、阻礙接力賽等田徑比賽,以及足球、舞蹈等受歡迎的方式,會讓人對人形機器人有一個潛移默化的認識。
其次,比賽是機器人技術(shù)訓練場。比賽中的很多場景都來自于真實的生活場景,比如工廠提出的物流搬運、醫(yī)院提出的藥業(yè)分揀、酒店服務(wù)等。,有助于提高機器人技術(shù);
第三,對于有潛在需求的客戶來說,比賽是一座橋梁,可以加快機器人產(chǎn)業(yè)化的落地,也可以加快試點在真實場景中的應(yīng)用。
Karol Hausman認為中國有各種各樣的機器人比賽,國外也有一些比賽,還有很多學術(shù)比賽,但是和中國的規(guī)模相比是無法比擬的,所以他非常期待看到中國比賽和機器人技術(shù)的發(fā)展和驗證。
王鶴和盧策吾都強調(diào)推動智能產(chǎn)業(yè)化的重要性。王鶴提到,如果銀河通用機器人在無人藥店等場景中的應(yīng)用能夠?qū)崿F(xiàn)24小時正常的人形機器人服務(wù),那就是智能產(chǎn)業(yè)化的起點。
“目前,我們已經(jīng)在北京落地了7家無人藥店,人形機器人已經(jīng)完成了24小時接藥和與騎手的工作,這不僅為夜間急需用藥的患者提供了及時的幫助,也打破了“人力24小時鎖定崗位”的傳統(tǒng)模式,緩解了特殊時期人力短缺的問題。今年,我們將在北京、上海和深圳擴展到100家無人藥店?!?/p>
“當超市的訂單處理、汽車制造商的調(diào)料等場景都可以由人形機器人“主人”決定時,技術(shù)才能真正融入生產(chǎn)生活。我們希望后續(xù)的比賽能夠滿足這些實際需求,以‘落地技能’為導向,讓比賽成為產(chǎn)業(yè)生態(tài)運行的‘催化劑’?!?王鶴表示。
對于這一點,盧策吾也表示贊同,“競爭是觀察機器人特性的‘起點’,但更重要的是讓機器人‘工作’‘創(chuàng)造價值’——未來可能需要大量的競爭來聚焦‘生產(chǎn)力’。” 他透露,該團隊正在不斷地接觸物理世界。 在食品食品加工領(lǐng)域應(yīng)用力反饋模型。
特別聲明:文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者根據(jù)這一操作自擔風險。
本文來自微信微信官方賬號“風險投資日報”,作者:李明明,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com