2025,具體智能是否迎來了“ChatGPT時刻”?| 峰瑞研究所
2025年, 人形機器人 該領域持續(xù)火熱, “科幻走進現(xiàn)實” 場景不斷涌現(xiàn)。
四月是世界上第一場比賽 半程馬拉松人形機器人 鳴槍開始跑步,各具特色的機器人選手在現(xiàn)實世界的跑道上行走;5月,世界上第一個以人形機器人為參賽主體的人。 格斗比賽 在中間,機器人完成了一系列格斗動作,如勾拳、側(cè)踢、躲閃等;八月 , 世界 人形機器人運動會 還將拉開序幕,有田徑、體操、足球等豐富多樣的比賽項目。
一年前,我們在那里 報告《通往具體智能之路》 指出,供應鏈成本效率優(yōu)勢的持續(xù)提升,以及第二、第三產(chǎn)業(yè)場景需求的快速增長,或成為 具有智能跑道 的持續(xù)性機會。一年過去,具有智能跑道 出現(xiàn)了 哪些變化 ? 涌現(xiàn)了 哪些 新的機會?
在 「What's Next|科技早知道」 在播客節(jié)目中,峰瑞資本執(zhí)行董事 劉鵬琦 和「聲動活潑」創(chuàng)始人&「科技早知道」主播 Diane丁教 ,以及「科技早知道」節(jié)目監(jiān)制 雅嫻 ,圍繞具體智能跑道的新階段和核心挑戰(zhàn),探討了包括但不限于在內(nèi)的以下問題:
當下這一波 具體智能熱潮的起點 在哪里?為什么一切都在 追尋“人”與“通用”?
人形機器人 軟硬件發(fā)展 與哪些因素有關?當前的核心挑戰(zhàn)是什么?
人形機器人 商業(yè)落地狀況 怎么樣?趨勢和機遇是什么?
我們截取了一些播客的內(nèi)容,希望能帶來新的思維視角。歡迎繼續(xù)和我們一起觀察和討論。也歡迎來到小宇宙APP。 或 Apple podcast,搜索并訂閱「What's Next|科技早知道」完整版本的收聽。
/ 01 /
制造機器人,為什么要追求?
“人”與“通用”?
雅嫻:最近,機器人馬拉松非常受關注,世界人形機器人運動會也將于八月舉行。為什么這波具身智能如此火爆?
劉鵬琦:這次由亦莊舉行 半程馬拉松賽人形機器人 事情挺出圈的。除投資圈的小伙伴外,我觀察到許多跑步小組也在討論,關注機器人能否完成比賽。
第一次是人形機器人 走出實驗室環(huán)境 ,馬拉松挑戰(zhàn)在現(xiàn)實中已經(jīng)完成了這么長時間。從結(jié)果來看,機器人的完成率可能是 30% ,第一名比許多人類選手還快,其實挺了不起的。
特斯拉宣布進入 人形機器人,是這一波熱潮之一。 代表性起點。
2021年, 特斯拉正式宣布人形機器人計劃,提出 “Tesla Bot” 概念;2022年,特斯拉正式發(fā)布人形機器人 Optimus 原型機(擎天柱)。
同年, Figure AI 建立,重點開發(fā)通用類人形機器人。
不像之前成立的人形機器人公司,Optimus和Figure AI的目標非常明確。它們不僅限于制造一個可以實現(xiàn)復雜和酷炫動作的機器人,還可以制造機器人。 送到工廠,參與生產(chǎn) 。
2022、2023年前后 ,國內(nèi)許多團隊也相繼成立,下注具體的智能方向,如智元機器人、銀河通用、逐際動力等。
為何每個人都選擇這個時間節(jié)點的結(jié)局?可以從軟件和硬件兩個方面來理解。
就硬件而言,過去十年, 新型能源產(chǎn)業(yè),工業(yè)自動化,消費電力 子等領域的 工業(yè)化,規(guī)模化 隨著水平的提高,包括電機、傳感器、電池在內(nèi)的硬件和零件上下游系統(tǒng)得到了改進, 降低了建造機器人的門檻。
就軟件而言,從2022年底開始, 大型模型的出現(xiàn) 它被認為是一個提高機器人算法模型能力的機會,尤其是 感知決 策方面。 這樣就給了行業(yè)很大的想象空間,去構思將來做通用機器人的可能性。
雅嫻:2017年,宇樹推出的四足機器人可以完成很多任務。例如,在工廠里,機械臂非常熟練地操作和組裝汽車,并做一些詳細的操作。那為何必須這樣做把機器人 做成“人型” ? 為何必須這樣做 追尋“通用”?
劉鵬琦:“人型”在一定程度上反映了人類心靈深處對未來通用機器人的終極形態(tài)。 普遍的想象。 許多科幻電影、電視劇所呈現(xiàn)的機器人形象也與人類相似,比如動畫電影《超能陸戰(zhàn)隊》中的服務機器人“大白”。
就技術而言,人類所體現(xiàn)的 技術和通用能力 也許看起來更高級,也因此,許多企業(yè)將“人型”視為目標。
但是對于狹義的人型和非人型來說,“有沒有腿”主要表現(xiàn)在 移 動力能力的差異。 在移動能力方面,可以說80%-90%的場景不需要人型,輪試底盤就夠了。所以現(xiàn)在我們可以看到,更多的公司已經(jīng)開始將資源投入其中。 機器人的上身, 特別是 操作技能 在研究和開發(fā)方面,這可能是一個更能發(fā)揮商業(yè)價值的地方。
雅嫻:為了被稱為“通用”,機器人需要具備哪些能力?
劉鵬琦:目前我們討論的是通用機器人,人形,以及在大模型領域討論AGI的想法。 通用 是我們 追尋最終目標, 但是挑戰(zhàn)在于整個世界。 資源有限。 我們還需要平衡,同時追求通用性。 效率,通過率,成本 等因素。
例如,在 工業(yè),制造業(yè) 與能否通用相比,效率、通過率、成本等各種因素顯然更為重要。但是現(xiàn)在 家政服務 實用性在場景中更為重要。機器人可以犧牲一定的成功率和效率,但是相對來說可以做更多的事情。
目前,業(yè)界還沒有就通用機器人所需的能力達成共識。我認為我們可以參考自動駕駛能力,從L1到L5對通用機器人進行分類和定義,分類指標可以看到它覆蓋了多少場景,不同場景覆蓋了多少任務。
丁教:在機器人領域,無論是研究階段還是應用領域,更需要的是 收斂 ,而不是 泛化 ?
劉鵬琦:偏向?qū)W術學校的創(chuàng)始人可能更贊同直接追求全場景泛化的路線。偏向產(chǎn)業(yè)背景的創(chuàng)始人可能會在一般方向做減法,選擇解決一個垂直場景的問題,然后在未來做其他場景。但不能一概而論。
/ 02 /
軟件和硬件是服務機器人所需的。
發(fā)展如何?
雅嫻:現(xiàn)在機器人需要什么樣的硬件,現(xiàn)在不同的硬件已經(jīng)發(fā)展到什么階段?
劉鵬琦:可簡單地將機器人硬件分為幾類: 機械部分 (類似于人的骨骼、肌肉、肌腱)、 傳感 (類似于人的五官,觸感)、 控制 (類似于人腦、小腦、神經(jīng)系統(tǒng)),以及配套設施 供能系統(tǒng),通信系統(tǒng) 等。
從投資的角度來看,不同種類的硬件模塊處于完全不同的發(fā)展階段,這與 模塊化相關產(chǎn)業(yè)的成熟度 相關。
目前很多完善的硬件模塊都是新能源汽車、工業(yè)自動化、消費電子等。 大規(guī)模發(fā)展后,成熟產(chǎn)業(yè)溢出成果。
例如 關節(jié)減速機 ,它是機器人廣泛使用的一體化關節(jié)的重要組成部分。關節(jié)減速器在新能源汽車和工業(yè)自動化行業(yè)發(fā)展良好,成本不斷降低。機器人行業(yè)可以用一點定制。
再比如 傳感器 ,得益于自動駕駛和掃地機器人行業(yè)的發(fā)展,激光雷達、毫米波雷達等視覺感知模塊的成本較低,可以使機器人 “用于即用”。
相反,還有一些不完善的硬件模塊,其核心部件過去在其他行業(yè)方向沒有產(chǎn)業(yè)化和規(guī)?;姆e累,需要智能化。 定制研發(fā)。 這種情況也存在 創(chuàng)業(yè),投資的機會。
例如 靈巧手 (一種新型的機器人終端執(zhí)行器是機器人與環(huán)境相互作用的最終階段和執(zhí)行部件)以及相關的觸感和力覺傳感器。2024年之前,靈巧手的應用場景主要是假肢和科研。近年來,隨著智能行業(yè)的日益普及,靈巧手“帶火”,吸引更多的資金和人才進入市場,促進其發(fā)展。
因時機器人 這是一個特別有趣的例子。2021年,當峰瑞在A輪投資機器人時,該公司已經(jīng)有了一個靈巧的產(chǎn)品演示,但當時我們更關注它的核心部件。 微型伺服電缸 (線性關節(jié),又稱線性執(zhí)行器,是集成伺服電機、減速器、絲杠等部件的一體化運動模塊)。
當時,由于機器人微伺服電缸已經(jīng)在新能源行業(yè)和美容行業(yè)得到了成熟的應用,靈巧的手是技術實力的證明,盡管收入占比不高?,F(xiàn)在看來,微型伺服電缸的核心部件技術逐漸成熟,成本逐漸下降,這可能是由其他大型行業(yè)推動的,最終為智能手的實用性積累了關鍵能力?,F(xiàn)在,由于機器人在靈巧手跑道上的先發(fā)優(yōu)勢明顯,在行業(yè)內(nèi)出貨量領先。
因此,人形機器人零部件、硬件模塊的成熟程度在初期是非常依賴的。 支持其它成熟產(chǎn)業(yè)。 假如只靠自己的智能產(chǎn)業(yè)本身,會比較慢,比較難。
丁教:使我想起了樂森機器人,以前做伺服電機,后來轉(zhuǎn)行做玩具行業(yè),反而在商業(yè)上取得了巨大的成功。
劉鵬琦:公司在其它行業(yè)積累、卷出的能力, 新興市場 事實上,反而可能更符合市場邏輯。
雅嫻:談完硬件,我們再來看看軟件。機器人控制系統(tǒng)有兩條主流的發(fā)展路線。
一條是 端到端架構 (end to end,指讓大模型直接理解問題,給出決策或答案) VLA模型 (visual language action,指從語言視覺端投射到行動端),特斯拉車輛的FSD(Full-Self Driving,全自動駕駛)是端到端的典型代表。
另一條是 傳統(tǒng)的控制系統(tǒng), 將機器人運動部件分為感知、決策、控制等模塊, AI模型結(jié)合AI模型分模組合 實現(xiàn)各種功能。
劉鵬琦:我認為這兩條路線 并非“非零即一”的狀態(tài), 有很多相互借鑒的折中方案。
比如分層模型的一兩個模塊可以用大模型來實現(xiàn)部分端到端;VLA內(nèi)部也可以設計成分層結(jié)構,比如分為兩個不同速度的系統(tǒng)結(jié)構。
公司需要根據(jù)自己的需求 定位、場景、商業(yè)模式, 選對路線。
近十年來自動駕駛的發(fā)展狀況,能為具身智能產(chǎn)業(yè)提供參考。
在自動駕駛行業(yè)發(fā)展初期,市場上有企業(yè)一上來就制定終極L4(高度自動駕駛)計劃,也有企業(yè)先制定L2(部分自動駕駛)計劃。制定L2計劃的企業(yè)通常會在訓練模型之前將足夠的商品推向市場。
特斯拉的FSD并非最初實現(xiàn)了端到端的模型。它也可能是 首先進行分層模型, 足夠多的積累 用戶信息 ,再反過來 訓練端到端模型。
當然,端到端模型不一定是“終點”。業(yè)內(nèi)人士認為,端到端模型最多可以起到模仿學習的作用。是否需要添加更多的其他方式和數(shù)據(jù)來訓練端到端模型,主要取決于公司的定位和想法。
雅嫻:端到端模型有什么優(yōu)點?
劉鵬琦:最簡單的理解是,端到端的模型結(jié)構看起來更簡單、更干凈。如果有足夠的數(shù)據(jù)計算率,就有可能發(fā)揮作用。 Scaling law (OpenAI提出的規(guī)模法則認為,大型模型的最終性能主要與計算量、模型參數(shù)和培訓信息量有關)的優(yōu)勢直接將模型運行出來。
問題是,是的 具體使用場景 里, 從而達到結(jié)果的成功率模型 有多高,比如精度能否達到行業(yè)目標。以自動駕駛為例,端到端模型的上限是否達到100公里左右接管一次?一百公里一次就夠了嗎?
雅嫻:現(xiàn)在在通用機器人中使用大型模型,有什么挑戰(zhàn)?
劉鵬琦:在 偏機器人大腦 挑戰(zhàn)部分在于機器人。 需要與物理世界互動, 需要感知環(huán)境的3D信息和物理性質(zhì),但目前大模型可以為機器人提供的關于“現(xiàn)實世界”的信息相對有限。自動駕駛之所以能使用大模型,是因為車輛和環(huán)境之間的交互需求相對較少,盡量避免與外界的接觸和碰撞。
規(guī)劃、控制操作等 偏小腦 部分,目前的大模型可能遠遠不能滿足機器人的需求。 準確性和響應速度。 舉例來說,機器人終端控制系統(tǒng)可能需要數(shù)百甚至數(shù)千HZ的信號更新頻率,目前大型Transformer結(jié)構(一種新型深度神經(jīng)網(wǎng)絡結(jié)構,是目前主流大型模型的基礎結(jié)構)更難實現(xiàn)這種更新頻率。
從另一個角度來看,具身智能實際上是一種 AI面向物理世界 Agent (智能體)。良好的AI 需要Agent 環(huán)境感知與記憶, 還要 推理管理能力, 更重要的是 Tool use (使用工具,指 AI Agent 有效地利用外部工具來提高其執(zhí)行任務的能力)。身體智能是一種AI。 Agent還需要具備上述特性。隨著大模型能力的發(fā)展,具有智能的環(huán)境感知和推理管理能力可以得到提高,但Tool與物理世界互動。 顯然,use面臨著更大的挑戰(zhàn)。
/ 03 /
在投資熱潮下,
具體智能跑道的趨勢和機會是什么?
雅嫻:人形機器人 商業(yè)化 處于什么階段? 落地狀況 怎樣?
劉鵬琦:首先,從技術角度來看。許多技術,包括端到端模型。 研究階段很早。
所以,許多企業(yè)考慮的核心問題并非商業(yè)化?,F(xiàn)在,每個人的戰(zhàn)略重點都集中在 怎樣獲得更多的資源,促進前沿技術的研發(fā)。
從投資的角度來看,具身智能是 明顯過熱 在Gartner技術成熟度曲線上,狀態(tài)可能是 第一波高點 的位置。
“熱”的好處在于, 加快相關技術和產(chǎn)業(yè)的完善。 比如靈巧手,在獲得資本支持之后,行業(yè)內(nèi)出現(xiàn)了許多不錯的解決方案。
即使后續(xù)的智能產(chǎn)業(yè)進入資本低潮和冷靜期,也會產(chǎn)生許多 “沿路生蛋” 機會。其中,模型、算法和核心部件是由智能行業(yè)開發(fā)的,可能會 溢出到其它行業(yè), 比如增強當前智能機器人的能力,做出現(xiàn)在很難實現(xiàn)的機械臂形態(tài)?,F(xiàn)在有些工業(yè)機器人只能在非常固定的過程中活動,未來可能會在更泛化的場景中執(zhí)行多任務。
從 量 產(chǎn)的角度 看來,目前國內(nèi)能夠?qū)崿F(xiàn)大規(guī)模量產(chǎn)的具體智能公司并不多,其中最大的挑戰(zhàn)之一是 PMF還沒找到 (Product Market Fit,產(chǎn)品與市場達到最佳契合點),現(xiàn)在更多的是服務于科研情況和展示需求。另外,軟件方面 上臂操作技巧, 以及硬件方面 機械性能、可靠性和成本平衡, 還有優(yōu)化的空間。
假如討論未來人形機器人是如何著陸的, “不可能三角”的平衡 (指一件事同時存在三個要素,三者不能同時存在),在具體智能領域主要是指具體智能領域。 通過率,實用性和支出。
人形機器人在中國市場需要實現(xiàn) 通過率高于人工操作,在垂直場景中實現(xiàn)泛化, 尤其適合切入 附加值相對較高 的行業(yè)。
比如, 人工試驗在生物醫(yī)學領域的階段 也許可以由機器人來完成。首先,實驗室所需的操作比較有限,對機器人的實用性要求也比較低。第二,在實際試驗過程中,機器人可能比人工更準確地控制試驗條件和規(guī)范操作。另外,實驗操作者一般需具有本科及以上學歷,并具有化學或生物學等學科背景,屬于高技能勞動力。如果人形機器人能夠做到這一替代工作, 可以創(chuàng)造經(jīng)濟附加值 相對來說也會更高。
相比之下,人形機器人可能不容易。 勞動力集中的場景 其中一個原因是這些場景的附加值較低,比如倉儲物流或工業(yè)場景。此外,我國勞動力成本低,海外勞動力成本高。因此, 國外市場 更加需要人形機器人來代替人力。
當然,我們也觀察到了機器人。 工業(yè)領域 試一試,比如造車,但是現(xiàn)在機器人更有可能只做一些質(zhì)檢、隨機運輸?shù)裙ぷ鳎?真正進入核心生產(chǎn)環(huán)節(jié) 還有很長的路要走。
國內(nèi)外做人形機器人的企業(yè)畫像有許多不同之處。
在美國,著名的人形機器人公司包括特斯拉,F(xiàn)igure AI、Physik Instrumente(PI)等, 新興企業(yè)數(shù)量不多,但單一企業(yè)估值和融資額較高。 總的來說,美國企業(yè)傾向于追求追求 技術領先, 研究開發(fā)側(cè)重于機器人的大腦部分,如軟件和算法。除Optimus和Figure之外, 除了AI等少數(shù)企業(yè), 自研機器人本體 公司不多。
進入中國人形機器人的企業(yè) 數(shù)量很多, 除遙遙領先的第一梯隊外,還有無數(shù)的第二梯隊、第三梯隊。根據(jù)新戰(zhàn)略人形機器人產(chǎn)業(yè)研究所的估計,2025年上半年仍有許多企業(yè)家進入。另外,看起來中國的具身智能企業(yè)也許更想要。 實現(xiàn)“全能”, 比如既做軟件又做自己的硬件,既要展示酷炫的技術demo、還要有落地思考和布局。
就市場環(huán)境而言,中國在孕育人形機器人行業(yè)方面具有獨特的優(yōu)勢:完善 產(chǎn)業(yè)鏈基礎 、規(guī)?;?市場需求 、積極的 政策引導 ,以及廣闊的 出海機會 。
雅嫻:對未來的人形機器人來說,公眾可能會有一些“機器人進入家庭”的想象。就目前的技術發(fā)展階段而言, 進入家庭場景的機器人 是否需要更長的時間?
劉鵬琦:的確。當機器人進入家庭時,除了成功率、實用性和成本之外,還有很多問題需要考慮在“不可能三角”中。 倫理問題,哲學問題 需要解決和克服。
丁教:但愿在資本的推動下,具身智能產(chǎn)業(yè)能迎來一個新的發(fā)展。 技術突破節(jié)點, 一點一點向前推進,我想最終應該能夠?qū)崿F(xiàn)這個目標。
劉鵬琦:假如僅僅靠一波就把它推到了最后的高度,那么這件事肯定不是什么大事。一件大事必須是 需要幾波浪潮, 把它推到最后。
雅嫻:那么現(xiàn)在機器人到了嗎? ChatGPT時刻?
劉鵬琦:我覺得還遠沒有到。
在2024年5月,我們發(fā)表了一份報告《通往具體智能之路》。
和一年前相比,我想 具體智能變得更加火爆, 更多的團隊出現(xiàn),更多的機構進入。不變的是,整個行業(yè)仍然存在。 處于起步階段, 雖然機器人馬拉松等很多現(xiàn)象“爆紅”,但是商業(yè)化還是很少的。
在硬件領域,大量新的創(chuàng)業(yè)公司和團隊布局 力量傳感器,觸覺傳感器,靈巧手等。 在 小腦機器人數(shù)據(jù) 在這一細分方向上,出現(xiàn)了公司或平臺,提供遙操作、動捕和生成模擬數(shù)據(jù)。這也符合之前在報告中的判斷。
在未來,新的趨勢和機遇可能會出現(xiàn) 控制大腦和小腦算法 另一方面,這是目前智力最大的瓶頸之一。解決辦法可能是先選擇一個。 考慮到落地場景的通過率、實用性和成本, 形成現(xiàn)有的技術能力 閉環(huán)解決方案, 積累 場景數(shù)據(jù), 再逐步演變 新型算法架構。
若延長時間線,人形機器人的終極形態(tài)就會出現(xiàn), 實現(xiàn)晚于量子計算和核聚變。 像漫威漫畫中的鋼鐵俠一樣,人形機器人可能會將可控核聚變視為 能源設備 、作為量子計算 計算單元 ,然后真正實現(xiàn) 一般人型機的形態(tài)。
本文來自微信公眾號“峰瑞資本”(ID:freesvc),作者:與企業(yè)家同行,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com