亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

頂級(jí)AI科學(xué)家李飛飛說:機(jī)器人的進(jìn)化離不開空間智能

2024-06-07

智東西6月4日?qǐng)?bào)道,今年4月,著名計(jì)算機(jī)科學(xué)家、斯坦福教授李飛飛在溫哥華舉行的2024年TED會(huì)議上發(fā)表了題為《有了空間智能,AI就會(huì)理解現(xiàn)實(shí)世界》的15分鐘演講,分享了她對(duì)空間智能及其改變世界的看法。


值得注意的是,從2024年初到2025年底,李飛飛在斯坦福大學(xué)的個(gè)人資料顯示,她處于部分休假狀態(tài)。根據(jù)路透社的報(bào)道,她目前正在創(chuàng)辦一家創(chuàng)業(yè)公司,創(chuàng)業(yè)的方向是空間智能。


在演講中,李飛飛提到,隨著神經(jīng)網(wǎng)絡(luò)算法的出現(xiàn),GPU能力的提高,以及大數(shù)據(jù)的幫助,計(jì)算機(jī)視覺領(lǐng)域發(fā)展迅速。


目前,研究人員不再滿足于只讓計(jì)算機(jī)看到世界,而是在觀察世界的三維空間時(shí),追求讓計(jì)算機(jī)了解世界,學(xué)習(xí)知識(shí),采取行動(dòng)。這就是所謂的“空間智能”(Spatial Intelligence)。


李飛飛指出,行為的沖動(dòng)是所有具有空間智能的生物的天性。如果我們想在目前的AI實(shí)現(xiàn)能力上有所突破,充分發(fā)揮當(dāng)前數(shù)字寒武紀(jì)大爆發(fā)的潛力,空間智能是不可或缺的。


與此同時(shí),她還提醒我們,實(shí)現(xiàn)空間智能并不容易。開發(fā)人員需要慎重考慮,確保AI技術(shù)始終以人為本。但是如果我們真的能夠開發(fā)出造福人類的空間智能計(jì)算機(jī)和機(jī)器人,我們一定會(huì)創(chuàng)造一個(gè)更加美好的世界。


下面是李飛飛4月TED演講的完整編譯:


01.看世界了解世界,是一種智能催化劑。


我想向你展示一些東西。確切地說,我想展示的是一片空虛。這就是5.4億年前的世界:簡(jiǎn)單而無盡的黑暗。世界之所以黑暗,不是因?yàn)槿狈庠?,而是因?yàn)槿狈δ芸吹绞澜绲难劬Α?/p>


在這個(gè)世界上,陽光可以穿過一公里深的海底,海底的熱液噴嘴也在發(fā)光,生命在這里蓬勃發(fā)展。但是在這些古老的水域里,沒有眼睛能看到這些場(chǎng)景。沒有視網(wǎng)膜,沒有角膜,沒有晶狀體。沒有人見證所有這些光輝和生命。


過去,“看”這個(gè)概念并不存在,沒有生物能真正看到世界。直到這一刻到來。


三葉蟲出現(xiàn)了,這是地球上第一種能感知光的生物。我們目前只知道它們出現(xiàn)的原因。但它們是我們現(xiàn)在習(xí)慣的生活環(huán)境中的第一批居民,也是第一批發(fā)現(xiàn)除了自己之外還有其他東西的生物。他們意識(shí)到世界是由許多其他“自我”組成的。


視覺被稱為寒武紀(jì)生命爆發(fā)背后的驅(qū)動(dòng)力。這是一個(gè)動(dòng)物物種大量進(jìn)入化石記錄的階段。起初,這些動(dòng)物只是被動(dòng)地接受光源,并逐漸演變成更積極的行為。神經(jīng)系統(tǒng)開始進(jìn)化。視力轉(zhuǎn)化為洞察力,理解轉(zhuǎn)化為行動(dòng),這些都催生了智力。


02.三股力量推動(dòng)AI時(shí)代的到來是不可能的。


現(xiàn)在,我們不再滿足于僅僅依靠大自然賦予我們的視覺智能。好奇心驅(qū)使我們創(chuàng)造出像我們這樣甚至更聰明的機(jī)器。


九年前,在這個(gè)舞臺(tái)上,我報(bào)告了AI支部領(lǐng)域計(jì)算機(jī)視覺的初步進(jìn)展。當(dāng)時(shí),三股強(qiáng)大的力量首次聚集在一起:第一股力量是一個(gè)算法家族,被稱為神經(jīng)網(wǎng)絡(luò);第二股力量是一個(gè)快速的特殊計(jì)算硬件,即GPU;三是大數(shù)據(jù),比如我的實(shí)驗(yàn)室當(dāng)時(shí)花了幾年時(shí)間建立的ImageNet照片數(shù)據(jù)庫。三股力量共同推動(dòng)了AI時(shí)代的到來。


現(xiàn)在我們?nèi)〉昧撕艽蟮倪M(jìn)步。當(dāng)時(shí)只是給照片貼上標(biāo)簽是一個(gè)很大的突破。然而,這些算法的速度和準(zhǔn)確性迅速提高。這一進(jìn)展由我的實(shí)驗(yàn)室主導(dǎo)的年度ImageNet大賽進(jìn)行了評(píng)估。在這張圖中,你可以看到每年的改進(jìn)和一個(gè)里程碑模型。


此外,我們還創(chuàng)建了一種算法,可以分割目標(biāo)或預(yù)測(cè)它們之間的動(dòng)態(tài)關(guān)系,這是我的學(xué)生和合作伙伴的工作成果。


不僅如此,還記得上次我展示的第一個(gè)可以用自然語言描述照片的計(jì)算機(jī)視覺算法嗎?那是我和我的杰出學(xué)生安卓。 Karpathy合作的有效性。那時(shí),我似乎很幸運(yùn)地問他:Andrej,Andrej笑著說:“哈哈,那是不可能的,我們能讓電腦做相反的操作嗎?”


但是正如這條推文所說,不久前,不可能的事變成了可能。


得益于一系列的擴(kuò)散模式,它們促進(jìn)了生成式AI算法的發(fā)展。根據(jù)人類提醒的句子,這些算法可以生成全新的照片和視頻。許多人已經(jīng)看到了OpenAISora最近令人印象深刻的結(jié)果。


但是即使沒有大量的GPU,我的學(xué)生和我們的合作伙伴也開發(fā)了一種叫做Walt的視頻模型。我們的模型發(fā)布日期領(lǐng)先于Sora幾個(gè)月。你現(xiàn)在看到的是其中的一些結(jié)果。


這些結(jié)果還有優(yōu)化的空間??簇埖难劬?,貓雖然在水下,但并沒有弄濕自己。這真是一場(chǎng)災(zāi)難。(cat-astrophe)。


03.看到世界遠(yuǎn)遠(yuǎn)不夠空間智能,讓看到變成行動(dòng)。


過去只是一個(gè)序言,我們將從這些錯(cuò)誤中學(xué)習(xí),創(chuàng)造我們想象的未來。在這個(gè)未來,我們希望AI能夠幫助我們完成一切,或者有能力幫助我們完成一切。


幾年來,我一直強(qiáng)調(diào),拍一張照片并不意味著看到和理解拍攝的內(nèi)容。今天,我想補(bǔ)充一點(diǎn)。光看是不夠的。



看看是為了做和學(xué)。


當(dāng)我們?cè)谌S空間和時(shí)間中向世界付諸行動(dòng)時(shí),我們也在學(xué)習(xí)。我們正在教如何更好地閱讀和做到這一點(diǎn)。這自然是由“空間智能”創(chuàng)造的。(Spatial Intelligence)驅(qū)動(dòng)良性循環(huán)。為了展示“空間智能”的用處,我想給你看這張圖。如果你看到后有做任何事情的沖動(dòng),請(qǐng)舉手。


在短短的一秒鐘里,你的大腦看到了玻璃的幾何形狀,它在三維空間中的位置,以及它與桌子、貓等一切的關(guān)系。你可以預(yù)測(cè)接下來會(huì)發(fā)生什么。


行為的沖動(dòng)是所有具有空間智能的生物的天性,這將感知與行動(dòng)聯(lián)系在一起。如果我們想推動(dòng)AI超越目前的能力水平,我們需要的不僅僅是看和說的AI。我們應(yīng)該能夠做出行為的AI。


04.空間智能已經(jīng)取得了初步的進(jìn)步。機(jī)器人可以為你做飯。


事實(shí)上,我們正在取得令人興奮的進(jìn)展。最近,空間智能的里程碑時(shí)間是教會(huì)計(jì)算機(jī)觀察、學(xué)習(xí)、行動(dòng)以及更好地學(xué)習(xí)和行動(dòng)。這并不容易。


進(jìn)化空間智能需要數(shù)百萬年的時(shí)間。這種智能需要依靠眼睛接收光源,將二維圖像投射到視網(wǎng)膜上,然后讓大腦將這些數(shù)據(jù)轉(zhuǎn)換成三維信息。


最近,谷歌的一組研究人員開發(fā)了一種算法,可以將一組照片轉(zhuǎn)換成三維空間(如圖所示)。


我們的學(xué)生和我們的合作伙伴進(jìn)一步創(chuàng)建了一個(gè)可以將一個(gè)輸入圖像轉(zhuǎn)換成三維形狀的算法(如圖所示)。



還記得我們談過的計(jì)算機(jī)程序,可以把人類的句子轉(zhuǎn)換成視頻嗎?密歇根大學(xué)的一組研究人員找到了一種方法,將這句話轉(zhuǎn)換成三維房間設(shè)計(jì)(如圖)。


我在斯坦福的同事和他們的學(xué)生開發(fā)了一種算法,它可以從一張圖片中產(chǎn)生無限可能的空間,供觀眾探索(如圖)。


這些都是未來各種可能的萌芽。一個(gè)可以把我們整個(gè)世界變成數(shù)字的方法,通過建模展示世界豐富而不同的未來。


自然,這些事情都是在我們自己的頭腦中秘密完成的??臻g智能技術(shù)有望為我們的集體意識(shí)實(shí)現(xiàn)這一點(diǎn)。隨著空間智能的加速發(fā)展,一個(gè)新的良性循環(huán)正在我們面前進(jìn)行。


這種相互作用正在催化機(jī)器人學(xué)習(xí)。這是具體智能系統(tǒng)的關(guān)鍵組成部分,需要理解和與三維世界互動(dòng)。


十年前,我實(shí)驗(yàn)室的ImageNet數(shù)據(jù)庫幫助訓(xùn)練計(jì)算機(jī),讓它們看得見。現(xiàn)在,我們正在用行為和動(dòng)作來訓(xùn)練計(jì)算機(jī)和機(jī)器人,使它們能夠在三維世界中行動(dòng)。


然而,我們沒有收集靜態(tài)圖像,而是開發(fā)了一個(gè)由三維空間模型驅(qū)動(dòng)的模擬環(huán)境,這樣計(jì)算機(jī)就可以以無限多樣的概率學(xué)習(xí)行動(dòng)。你現(xiàn)在看到的是我實(shí)驗(yàn)室領(lǐng)導(dǎo)的Behavior項(xiàng)目中機(jī)器人學(xué)習(xí)的例子。



我們?cè)跈C(jī)器人語言智能方面也取得了令人興奮的進(jìn)展。我的學(xué)生和合作伙伴是第一批在這方面取得進(jìn)步的團(tuán)隊(duì)?;诖笮驼Z言模型的輸入,他們開發(fā)的機(jī)械臂現(xiàn)在可以根據(jù)口頭指令執(zhí)行各種任務(wù)。


比如打開抽屜或者拔出充電手機(jī),或者用面包、生菜、西紅柿做三明治,甚至給用戶放紙巾。一般來說,我想在三明治里放更多的材料,但這是一個(gè)好的開始。


未來空間智能有望在醫(yī)療等領(lǐng)域發(fā)揮重要作用。


在古代,在原始的海洋中,看到和感知環(huán)境的能力開啟了寒武紀(jì)大爆發(fā)的帷幕,不同的生活形式開始互動(dòng)?,F(xiàn)在,光輝正在觸摸數(shù)字大腦。


空間智能不僅可以使機(jī)器與其他機(jī)器互動(dòng),還可以與人類和真實(shí)或虛擬的三維世界互動(dòng)。隨著這種未來逐漸成為現(xiàn)實(shí),它將對(duì)許多人的生活產(chǎn)生深遠(yuǎn)的影響。


讓我們以醫(yī)療為例。在過去的十年里,我的實(shí)驗(yàn)室一直在使用AI來處理病人預(yù)后不良和醫(yī)護(hù)人員過度勞累的問題。


我們正在與斯坦福醫(yī)學(xué)院和合作醫(yī)院的工作人員合作,試圖使用智能傳感器。這些傳感器可以檢測(cè)醫(yī)護(hù)人員進(jìn)入病房時(shí)是否正確洗手,并在患者處于危險(xiǎn)(如摔倒)時(shí)跟蹤手術(shù)器械或提示護(hù)理團(tuán)隊(duì)。


我們把這些技術(shù)當(dāng)成一種環(huán)境智能,就像一雙額外的眼睛。它們確實(shí)可以起到一些作用。但我希望為我們的病人、醫(yī)護(hù)人員和護(hù)理人員提供更多的互動(dòng)幫助,他們迫切需要一個(gè)真正能做點(diǎn)什么的幫手。


想象一下,如果有一個(gè)可以運(yùn)輸醫(yī)療用品的獨(dú)立機(jī)器人,醫(yī)護(hù)人員只需要致力于患者。通過使用增強(qiáng)現(xiàn)實(shí)技術(shù),我們還可以引導(dǎo)外科醫(yī)生進(jìn)行更安全、更快、創(chuàng)傷更小的手術(shù)。


想象一下,嚴(yán)重癱瘓的患者通過腦電波控制機(jī)器人來完成我們常見的日常任務(wù)。是的,你可以通過腦電波。在我實(shí)驗(yàn)室最近的一項(xiàng)試點(diǎn)研究中,我們可以看到這種未來的雛形。



在這個(gè)例子中,機(jī)械臂的控制是通過非侵入性腦電帽收集的腦波信號(hào)來實(shí)現(xiàn)的。這個(gè)機(jī)械臂現(xiàn)在正在煮一頓生日快餐。


06.數(shù)字生命寒武紀(jì)大爆發(fā)即將來臨,但必須確保技術(shù)始終以人為本。


五億年前,視覺的出現(xiàn)徹底顛覆了原本黑暗的世界。它開始了一個(gè)影響最深遠(yuǎn)的進(jìn)化過程:動(dòng)物世界中智能化的發(fā)展。


在過去的十年里,AI的驚人進(jìn)步也令人震驚。但我相信,要想充分發(fā)揮數(shù)字寒武紀(jì)大爆發(fā)的潛力,就必須為計(jì)算機(jī)和機(jī)器人提供空間智能。這就是大自然為我們提供的。


這是一個(gè)激動(dòng)人心的時(shí)刻。我們可以教我們的數(shù)字伙伴學(xué)習(xí)推理,教他們與我們稱之為家的三維空間互動(dòng),帶來更多我們可以探索的新世界。


實(shí)現(xiàn)這一未來并不容易。在付諸行動(dòng)時(shí),我們需要仔細(xì)考慮,始終以人為本的技術(shù)開發(fā)。


但是,如果我們能夠以正確的方式促進(jìn)技術(shù)的發(fā)展,這些具有空間智能的計(jì)算機(jī)和機(jī)器人不僅會(huì)成為實(shí)用的工具,還會(huì)成為可靠的伙伴,提高和提高我們的生產(chǎn)力,促進(jìn)人類社會(huì)的發(fā)展。他們還尊重人類個(gè)人的尊嚴(yán),促進(jìn)人類的共同繁榮。



最讓我興奮的是,AI將有更強(qiáng)的理解、洞察和空間感知能力,并與我們一起不懈努力,以更好的方式創(chuàng)造一個(gè)更好的世界。謝謝你。


結(jié)論:空間智能開啟AI發(fā)展新篇章將成為下一代AI的“原爆點(diǎn)”


在九年前的TED演講中,李飛飛介紹了深度學(xué)習(xí)的開始,ImageNet,這也為當(dāng)代AI奠定了基礎(chǔ)?,F(xiàn)在,她再次站在TED的舞臺(tái)上,詮釋了“空間智能”的新概念,引導(dǎo)AI走向更高的水平。


李飛飛本人在很多場(chǎng)合指出,AI領(lǐng)域能獲得的資源太有限了。她呼吁政府為AI探索的發(fā)展提供必要的支持?,F(xiàn)在,李飛飛已經(jīng)暫時(shí)離開象牙塔,最終創(chuàng)業(yè),并在硅谷著名風(fēng)險(xiǎn)投資公司a16z投資。我們也期待她在學(xué)術(shù)界之外給AI領(lǐng)域帶來新的驚喜。


本文來自微信微信官方賬號(hào)的“智東西”(ID:zhidxcom),作者:陳駿達(dá),36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com