干家務(wù)一小時(shí)掙1000元,具身智能時(shí)代人類新崗位
優(yōu)質(zhì)數(shù)據(jù)依然短缺
注意看,眼前這個(gè)男人暫且叫他小帥。
你可能想不到,他只是在廚房里優(yōu)雅地煎牛排做做家務(wù),每小時(shí)最高能賺進(jìn)1000多塊(150美元)。

怪不得小帥天天上班喜笑顏開。

難道他找到了什么神秘兼職?
畫面一轉(zhuǎn)——哦吼,機(jī)器人。

沒錯(cuò),這年頭,你做家務(wù)的視頻正被Encord、Micro1、Scale AI這些數(shù)據(jù)標(biāo)注服務(wù)商當(dāng)作訓(xùn)練人形機(jī)器人的人類高等素材,高價(jià)回收。

評(píng)論區(qū)網(wǎng)友只是一味地要招聘鏈接。


機(jī)器人也需“家教”
當(dāng)前,機(jī)器人是AI最熱門的領(lǐng)域之一。
硅谷著名投資人Vinod Khosla等押注該領(lǐng)域?qū)⒑芸煊瓉?lái)自己的“ChatGPT時(shí)刻”。PitchBook數(shù)據(jù)顯示,今年迄今機(jī)器人領(lǐng)域的風(fēng)險(xiǎn)投資已激增至121億美元。
然而,在技術(shù)爆發(fā)的另一面,是機(jī)器人行業(yè)共同面臨的數(shù)據(jù)荒。
“與大語(yǔ)言模型不同,機(jī)器人沒有現(xiàn)成的互聯(lián)網(wǎng)數(shù)據(jù)集可用,必須從零開始在現(xiàn)實(shí)世界中生成訓(xùn)練數(shù)據(jù),難度大得多”AI數(shù)據(jù)服務(wù)公司Encord聯(lián)合創(chuàng)始人Ulrik Hansen一針見血地指出。
目前,機(jī)器人訓(xùn)練數(shù)據(jù)的來(lái)源可以分為兩大路徑:現(xiàn)實(shí)世界真實(shí)數(shù)據(jù)與合成數(shù)據(jù)。
真實(shí)數(shù)據(jù)可通過精密設(shè)備遠(yuǎn)程操控機(jī)器人執(zhí)行任務(wù),同步記錄下包括關(guān)節(jié)力矩、電機(jī)旋轉(zhuǎn)等在內(nèi)的全套物理數(shù)據(jù)。這種方式能捕獲“手感”力控信息等。
或者可通過直接記錄人類在現(xiàn)實(shí)環(huán)境中的活動(dòng)來(lái)獲取,如Apple Vision Pro或?qū)I(yè)動(dòng)作捕捉系統(tǒng),記錄人類執(zhí)行任務(wù)的全過程。
這類數(shù)據(jù)質(zhì)量高、保真度強(qiáng),能準(zhǔn)確反映真實(shí)世界的復(fù)雜物理交互,但問題在于規(guī)模有限、成本高,難以滿足機(jī)器人模型對(duì)海量數(shù)據(jù)的需求。

合成數(shù)據(jù)則開辟了另一條路線。通過在虛擬環(huán)境中自動(dòng)生成無(wú)數(shù)種動(dòng)作變體或構(gòu)建完整交互場(chǎng)景,合成數(shù)據(jù)能以較低成本實(shí)現(xiàn)數(shù)據(jù)自由。
例如,NVIDIA Cosmos就是一個(gè)“世界基礎(chǔ)模型”,可以生成高度逼真、類似視頻游戲的環(huán)境,用于機(jī)器人訓(xùn)練。在這里,“世界”指的并不是地球,而是機(jī)器人交互的環(huán)境,如機(jī)器人操作的房間內(nèi)可見區(qū)域。

另外,為兼顧真實(shí)性與規(guī)模性,機(jī)器人公司往往采用結(jié)合真實(shí)與合成數(shù)據(jù)的方式,通過將少量的現(xiàn)實(shí)世界數(shù)據(jù)與大規(guī)模合成數(shù)據(jù)相結(jié)合,克服機(jī)器人技術(shù)中數(shù)據(jù)稀缺的問題。
面對(duì)數(shù)據(jù)饑渴,目前各家的應(yīng)對(duì)策略五花八門。
Encord透露,他們今年對(duì)此類數(shù)據(jù)的處理量已達(dá)到去年的四倍。他們高價(jià)回收真實(shí)數(shù)據(jù),如果是操作設(shè)備等高技術(shù)性任務(wù)的視頻,酬勞最高可達(dá)每小時(shí)150美元。
另一家AI數(shù)據(jù)服務(wù)公司Micro1 CEO Ali Ansari則透露,他們開出的報(bào)酬每小時(shí)在25至50美元之間。
另外,Scale AI宣布正快速拓展機(jī)器人業(yè)務(wù),并在其舊金山總部設(shè)立了專用實(shí)驗(yàn)室,迄今已生成超過10萬(wàn)小時(shí)的訓(xùn)練影像。
而需求則來(lái)自Physical Intelligence、波士頓動(dòng)力公司等。
甚至有某機(jī)器人初創(chuàng)公司自己在Craigslist發(fā)廣告,以10–20美元時(shí)薪征集用戶用手機(jī)拍攝家務(wù)的視頻。

盡管各方努力,優(yōu)質(zhì)數(shù)據(jù)依然短缺。該初創(chuàng)公司創(chuàng)始人對(duì)外透露:“市面上沒有大型數(shù)據(jù)集可購(gòu)買,規(guī)模最大的也僅有約5000小時(shí)時(shí)長(zhǎng),這遠(yuǎn)遠(yuǎn)不夠。”
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com


