對(duì)話機(jī)器人公司“加速進(jìn)化”:從踢足球到家庭保姆還有多遠(yuǎn)?
在剛結(jié)束不久的世界人形機(jī)器人運(yùn)動(dòng)會(huì)上,一支全程無遙控的踢足球機(jī)器人隊(duì)伍在網(wǎng)絡(luò)上引發(fā)關(guān)注。
這支踢足球的機(jī)器人隊(duì)伍來自加速進(jìn)化(北京)機(jī)器人科技有限公司(以下簡(jiǎn)稱“加速進(jìn)化”,英文名:Booster Robotics)。這家于2023年成立的公司,在今年7月舉行的2025 RoboCup巴西機(jī)器人足球世界杯上,助力中國(guó)隊(duì)(清華火神隊(duì))首次在AdultSize組別(人形機(jī)器人足球成人組一米以上機(jī)器人)奪冠,打破了歐美國(guó)家在該項(xiàng)頂級(jí)賽事上長(zhǎng)達(dá)28年的壟斷。

加速進(jìn)化機(jī)器人在足球場(chǎng)上的表現(xiàn)
為什么要讓機(jī)器人踢足球?實(shí)現(xiàn)無遙控操作機(jī)器人踢足球面臨哪些關(guān)鍵挑戰(zhàn)?
近日,澎湃科技(www.thepaper.cn)對(duì)加速進(jìn)化副總裁趙維晨進(jìn)行了專訪。趙維晨表示,將目標(biāo)鎖定足球賽事,是因?yàn)樽闱蛸愂且粋€(gè)高動(dòng)態(tài)、強(qiáng)對(duì)抗、對(duì)運(yùn)動(dòng)控制和決策智能要求極高的場(chǎng)景。

加速進(jìn)化副總裁趙維晨 受訪者供圖
趙維晨認(rèn)為,人形機(jī)器人應(yīng)先具備良好的運(yùn)動(dòng)能力,再追求智能完善。足球場(chǎng)景是鍛煉機(jī)器人運(yùn)動(dòng)能力、感知算法等關(guān)鍵技術(shù)的重要途徑,這些能力提升后可應(yīng)用于未來的家庭陪伴、教育等更多場(chǎng)景。
談到技術(shù)路徑,趙維晨認(rèn)為,當(dāng)前熱門的VLA技術(shù)路徑基于大語(yǔ)言模型,過度依賴海量標(biāo)注數(shù)據(jù)和固定模式,并非最優(yōu)解,三到四年內(nèi)會(huì)被顛覆。
以下是澎湃科技專訪內(nèi)容:
VLA算法未來三年內(nèi)會(huì)被全顛覆
澎湃科技:足球賽對(duì)人形機(jī)器人有哪些技術(shù)挑戰(zhàn)?
趙維晨:人形機(jī)器人要先有強(qiáng)大的運(yùn)動(dòng)能力,再發(fā)展智能。足球場(chǎng)景能鍛煉機(jī)器人的運(yùn)動(dòng)能力、感知算法,如識(shí)別球、隊(duì)友和對(duì)手位置等,還有定位導(dǎo)航和決策邏輯。這些能力未來可遷移到家庭場(chǎng)景,如機(jī)器人主動(dòng)迎接、跟隨、情感陪伴、充當(dāng)互動(dòng)教練,以及在工業(yè)場(chǎng)景實(shí)現(xiàn)精細(xì)手部操作。
澎湃科技:實(shí)現(xiàn)無遙控人形機(jī)器人參與踢足球的難度有多大?
趙維晨:足球賽事對(duì)抗激烈,機(jī)器人需要強(qiáng)大的運(yùn)控算法來保持平衡,摔倒后能在一秒內(nèi)自主起身。公司率先應(yīng)用端到端運(yùn)動(dòng)大模型,將視覺信號(hào)輸入神經(jīng)網(wǎng)絡(luò),輸出關(guān)節(jié)控制指令,提升了運(yùn)動(dòng)泛化性和穩(wěn)定性。比如大力射門,去年世界冠軍最高踢到35厘米,公司的機(jī)器人能踢到2米,直接越過人墻。
澎湃科技:你們的訓(xùn)練數(shù)據(jù)主要來自哪里?
趙維晨:主要來自足球場(chǎng)景采集的真實(shí)物理數(shù)據(jù),并結(jié)合視頻合成數(shù)據(jù),通過模仿學(xué)習(xí)加強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)視覺信號(hào)直接輸入神經(jīng)網(wǎng)絡(luò)。公司認(rèn)為,遙操的數(shù)據(jù)體量無法支撐具身大腦的訓(xùn)練,目前的視覺語(yǔ)言動(dòng)作模型(VLA)算法基于大語(yǔ)言模型,未來三年內(nèi)會(huì)被全新的底層算法體系取代。
澎湃科技:今年北京的世界機(jī)器人大會(huì)上關(guān)于視覺語(yǔ)言動(dòng)作模型(VLA)有很多爭(zhēng)議你們?cè)趺纯矗?/strong>
趙維晨:自動(dòng)駕駛單日數(shù)據(jù)量可達(dá)上億條,而全國(guó)具身最大的開源數(shù)據(jù)集規(guī)模才百萬級(jí)別(不到10TB)。大語(yǔ)言模型靠幾十年互聯(lián)網(wǎng)文本數(shù)據(jù)累積,而機(jī)器人即便加上雙輪雙臂操作10萬或100萬小時(shí),也難以訓(xùn)練出多模態(tài)具身大腦,只能驗(yàn)證早期算法框架。具身智能應(yīng)像自動(dòng)駕駛一樣,先通過L1、L2、L3落地收集真機(jī)數(shù)據(jù),再逐步迭代到AGI。從技術(shù)層面看,VLA模型不是最終解,它基于Transformer的LLM邏輯,依賴固定模式和海量標(biāo)注數(shù)據(jù),難以實(shí)現(xiàn)具身泛化。未來三到四年,現(xiàn)有的技術(shù)方案會(huì)被顛覆,可能會(huì)出現(xiàn)類似DeepSeek的開源方案。
機(jī)器人進(jìn)入家庭還需要10年
澎湃科技:2024年10月你們的BoosterT1發(fā)售,現(xiàn)在銷售情況如何?客戶主要是誰?
趙維晨:銷售未達(dá)預(yù)期。2025年上半年出貨交付了數(shù)百臺(tái),其中50%是全球化訂單,主要用于賽事和科研。頂尖球隊(duì)采購(gòu)機(jī)器人軟硬件平臺(tái),用于開發(fā)和測(cè)試決策算法。足球是開發(fā)者入門的理想場(chǎng)景,從入門到精通甚至能發(fā)表頂級(jí)論文。
澎湃科技:你們會(huì)擔(dān)心訂單量嗎?
趙維晨:對(duì)公司來說,核心是交付量。目前T1成本價(jià)在10萬元人民幣左右,很多公司簽署“意向訂單”,但沒有量產(chǎn)和交付能力就不算真正商業(yè)化。公司訂單交付周期在15到20天左右。未來商業(yè)化路徑清晰:短期面向賽事、科研、教育,是百億級(jí)賽道;中期從明年開始切入家庭搬運(yùn)、陪伴場(chǎng)景,目標(biāo)千億級(jí)市場(chǎng);長(zhǎng)期結(jié)合開發(fā)者生態(tài)向家庭管家、智能助理等通用機(jī)器人方向發(fā)展,是萬億級(jí)市場(chǎng)。
澎湃科技:目前投資人最關(guān)心你們的是哪幾個(gè)問題?
趙維晨:投資人比較關(guān)心公司的應(yīng)用Agent生態(tài)建設(shè)、硬件量產(chǎn)進(jìn)度、全球化進(jìn)度,以及運(yùn)控算法在全球市場(chǎng)的領(lǐng)先程度。
具身智能大模型還沒有顯著的共識(shí)
澎湃科技:在你們看來,人形機(jī)器人走進(jìn)家庭場(chǎng)景要經(jīng)過哪些場(chǎng)景和技術(shù)驗(yàn)證?
趙維晨:公司不做工業(yè)場(chǎng)景,因?yàn)楹?jiǎn)單任務(wù)已被傳統(tǒng)機(jī)械臂解決,剩下的要么太難五年內(nèi)無法落地,要么市場(chǎng)太小。輪加雙臂結(jié)構(gòu)早在5年前就有成熟的舵機(jī)高性價(jià)比解決方案,能滿足大多數(shù)封閉工業(yè)場(chǎng)景需求。公司重點(diǎn)發(fā)展家用機(jī)器人,將其打造成除手機(jī)、電腦外新的交互形態(tài)和生產(chǎn)力工具,要對(duì)標(biāo)蘋果和微軟,做好硬件(端)、操作系統(tǒng)、開發(fā)者工具三件事。就像手機(jī)電腦需要應(yīng)用才能普及,機(jī)器人進(jìn)家庭也需要第三方開發(fā)者基于開放生態(tài)、簡(jiǎn)單工具和操作系統(tǒng)開發(fā)應(yīng)用。大腦層面公司暫不著急投入,等三年后技術(shù)路線更清晰、有一定收入體量再進(jìn)行投入。
澎湃科技:是否可以理解為,你們也在等一個(gè)適配機(jī)器人的AI大腦?
趙維晨:公司認(rèn)為端+操作系統(tǒng)+開發(fā)工具和大腦都是萬億美元的市場(chǎng),但作為創(chuàng)業(yè)公司目前不會(huì)投入大腦研發(fā),成功率太低。等收入達(dá)100億人民幣、在大量垂直場(chǎng)景落地后,會(huì)開始大腦層面的投入,目前以合作為主。
澎湃科技:人形機(jī)器人進(jìn)入家庭,你們保守估計(jì)還有多久?這是一個(gè)目前可以預(yù)見的必然趨勢(shì)嗎?如果是,你們認(rèn)為會(huì)以怎樣的形態(tài)?
趙維晨:人形機(jī)器人進(jìn)入家庭一定會(huì)經(jīng)歷從早期使用者到早期大眾最后到后期大眾的過程。核心是通過殺手級(jí)應(yīng)用和教育進(jìn)入早期使用者群體,再通過生態(tài)成熟、應(yīng)用多樣化、成本下降進(jìn)入大眾市場(chǎng)。前者需要3年,進(jìn)入早期大眾可能需要5至10年,10年后實(shí)現(xiàn)較大規(guī)模普及。
澎湃科技:在你們看來,現(xiàn)在人形機(jī)器人還有哪些非共識(shí)問題有待解決?
趙維晨:一是大腦層面的技術(shù)路徑?jīng)]有達(dá)成共識(shí),目前VLA的路徑不是最終解。二是核心零部件硬件部分的技術(shù)路徑也未收斂,如靈巧手的驅(qū)動(dòng)方式多樣,且存在一些問題。當(dāng)下硬件本體的構(gòu)型有收斂趨勢(shì),外形變得相似,但在具身智能大模型領(lǐng)域,還沒有明顯的共識(shí)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com