亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<td id="0k2as"><dd id="0k2as"></dd></td>

頂級(jí)AI科學(xué)家李飛飛說：機(jī)器人的進(jìn)化離不開空間智能

2024-06-07

智東西6月4日?qǐng)?bào)道，今年4月，著名計(jì)算機(jī)科學(xué)家、斯坦福教授李飛飛在溫哥華舉行的2024年TED會(huì)議上發(fā)表了題為《有了空間智能，AI就會(huì)理解現(xiàn)實(shí)世界》的15分鐘演講，分享了她對(duì)空間智能及其改變世界的看法。

值得注意的是，從2024年初到2025年底，李飛飛在斯坦福大學(xué)的個(gè)人資料顯示，她處于部分休假狀態(tài)。根據(jù)路透社的報(bào)道，她目前正在創(chuàng)辦一家創(chuàng)業(yè)公司，創(chuàng)業(yè)的方向是空間智能。

在演講中，李飛飛提到，隨著神經(jīng)網(wǎng)絡(luò)算法的出現(xiàn)，GPU能力的提高，以及大數(shù)據(jù)的幫助，計(jì)算機(jī)視覺領(lǐng)域發(fā)展迅速。

目前，研究人員不再滿足于只讓計(jì)算機(jī)看到世界，而是在觀察世界的三維空間時(shí)，追求讓計(jì)算機(jī)了解世界，學(xué)習(xí)知識(shí)，采取行動(dòng)。這就是所謂的“空間智能”（Spatial Intelligence）。

李飛飛指出，行為的沖動(dòng)是所有具有空間智能的生物的天性。如果我們想在目前的AI實(shí)現(xiàn)能力上有所突破，充分發(fā)揮當(dāng)前數(shù)字寒武紀(jì)大爆發(fā)的潛力，空間智能是不可或缺的。

與此同時(shí)，她還提醒我們，實(shí)現(xiàn)空間智能并不容易。開發(fā)人員需要慎重考慮，確保AI技術(shù)始終以人為本。但是如果我們真的能夠開發(fā)出造福人類的空間智能計(jì)算機(jī)和機(jī)器人，我們一定會(huì)創(chuàng)造一個(gè)更加美好的世界。

下面是李飛飛4月TED演講的完整編譯：

01.看世界了解世界，是一種智能催化劑。

我想向你展示一些東西。確切地說，我想展示的是一片空虛。這就是5.4億年前的世界:簡(jiǎn)單而無盡的黑暗。世界之所以黑暗，不是因?yàn)槿狈庠?，而是因?yàn)槿狈δ芸吹绞澜绲难劬Α?/p>

在這個(gè)世界上，陽光可以穿過一公里深的海底，海底的熱液噴嘴也在發(fā)光，生命在這里蓬勃發(fā)展。但是在這些古老的水域里，沒有眼睛能看到這些場(chǎng)景。沒有視網(wǎng)膜，沒有角膜，沒有晶狀體。沒有人見證所有這些光輝和生命。

過去，“看”這個(gè)概念并不存在，沒有生物能真正看到世界。直到這一刻到來。

三葉蟲出現(xiàn)了，這是地球上第一種能感知光的生物。我們目前只知道它們出現(xiàn)的原因。但它們是我們現(xiàn)在習(xí)慣的生活環(huán)境中的第一批居民，也是第一批發(fā)現(xiàn)除了自己之外還有其他東西的生物。他們意識(shí)到世界是由許多其他“自我”組成的。

視覺被稱為寒武紀(jì)生命爆發(fā)背后的驅(qū)動(dòng)力。這是一個(gè)動(dòng)物物種大量進(jìn)入化石記錄的階段。起初，這些動(dòng)物只是被動(dòng)地接受光源，并逐漸演變成更積極的行為。神經(jīng)系統(tǒng)開始進(jìn)化。視力轉(zhuǎn)化為洞察力，理解轉(zhuǎn)化為行動(dòng)，這些都催生了智力。

02.三股力量推動(dòng)AI時(shí)代的到來是不可能的。

現(xiàn)在，我們不再滿足于僅僅依靠大自然賦予我們的視覺智能。好奇心驅(qū)使我們創(chuàng)造出像我們這樣甚至更聰明的機(jī)器。

九年前，在這個(gè)舞臺(tái)上，我報(bào)告了AI支部領(lǐng)域計(jì)算機(jī)視覺的初步進(jìn)展。當(dāng)時(shí)，三股強(qiáng)大的力量首次聚集在一起:第一股力量是一個(gè)算法家族，被稱為神經(jīng)網(wǎng)絡(luò)；第二股力量是一個(gè)快速的特殊計(jì)算硬件，即GPU；三是大數(shù)據(jù)，比如我的實(shí)驗(yàn)室當(dāng)時(shí)花了幾年時(shí)間建立的ImageNet照片數(shù)據(jù)庫。三股力量共同推動(dòng)了AI時(shí)代的到來。

現(xiàn)在我們?nèi)〉昧撕艽蟮倪M(jìn)步。當(dāng)時(shí)只是給照片貼上標(biāo)簽是一個(gè)很大的突破。然而，這些算法的速度和準(zhǔn)確性迅速提高。這一進(jìn)展由我的實(shí)驗(yàn)室主導(dǎo)的年度ImageNet大賽進(jìn)行了評(píng)估。在這張圖中，你可以看到每年的改進(jìn)和一個(gè)里程碑模型。

此外，我們還創(chuàng)建了一種算法，可以分割目標(biāo)或預(yù)測(cè)它們之間的動(dòng)態(tài)關(guān)系，這是我的學(xué)生和合作伙伴的工作成果。

不僅如此，還記得上次我展示的第一個(gè)可以用自然語言描述照片的計(jì)算機(jī)視覺算法嗎？那是我和我的杰出學(xué)生安卓。 Karpathy合作的有效性。那時(shí)，我似乎很幸運(yùn)地問他：Andrej，Andrej笑著說：“哈哈，那是不可能的，我們能讓電腦做相反的操作嗎？”

但是正如這條推文所說，不久前，不可能的事變成了可能。

得益于一系列的擴(kuò)散模式，它們促進(jìn)了生成式AI算法的發(fā)展。根據(jù)人類提醒的句子，這些算法可以生成全新的照片和視頻。許多人已經(jīng)看到了OpenAISora最近令人印象深刻的結(jié)果。

但是即使沒有大量的GPU，我的學(xué)生和我們的合作伙伴也開發(fā)了一種叫做Walt的視頻模型。我們的模型發(fā)布日期領(lǐng)先于Sora幾個(gè)月。你現(xiàn)在看到的是其中的一些結(jié)果。

這些結(jié)果還有優(yōu)化的空間?？簇埖难劬?，貓雖然在水下，但并沒有弄濕自己。這真是一場(chǎng)災(zāi)難。（cat-astrophe）。

03.看到世界遠(yuǎn)遠(yuǎn)不夠空間智能，讓看到變成行動(dòng)。

過去只是一個(gè)序言，我們將從這些錯(cuò)誤中學(xué)習(xí)，創(chuàng)造我們想象的未來。在這個(gè)未來，我們希望AI能夠幫助我們完成一切，或者有能力幫助我們完成一切。

幾年來，我一直強(qiáng)調(diào)，拍一張照片并不意味著看到和理解拍攝的內(nèi)容。今天，我想補(bǔ)充一點(diǎn)。光看是不夠的。

看看是為了做和學(xué)。

當(dāng)我們?cè)谌S空間和時(shí)間中向世界付諸行動(dòng)時(shí)，我們也在學(xué)習(xí)。我們正在教如何更好地閱讀和做到這一點(diǎn)。這自然是由“空間智能”創(chuàng)造的。（Spatial Intelligence）驅(qū)動(dòng)良性循環(huán)。為了展示“空間智能”的用處，我想給你看這張圖。如果你看到后有做任何事情的沖動(dòng)，請(qǐng)舉手。

在短短的一秒鐘里，你的大腦看到了玻璃的幾何形狀，它在三維空間中的位置，以及它與桌子、貓等一切的關(guān)系。你可以預(yù)測(cè)接下來會(huì)發(fā)生什么。

行為的沖動(dòng)是所有具有空間智能的生物的天性，這將感知與行動(dòng)聯(lián)系在一起。如果我們想推動(dòng)AI超越目前的能力水平，我們需要的不僅僅是看和說的AI。我們應(yīng)該能夠做出行為的AI。

04.空間智能已經(jīng)取得了初步的進(jìn)步。機(jī)器人可以為你做飯。

事實(shí)上，我們正在取得令人興奮的進(jìn)展。最近，空間智能的里程碑時(shí)間是教會(huì)計(jì)算機(jī)觀察、學(xué)習(xí)、行動(dòng)以及更好地學(xué)習(xí)和行動(dòng)。這并不容易。

進(jìn)化空間智能需要數(shù)百萬年的時(shí)間。這種智能需要依靠眼睛接收光源，將二維圖像投射到視網(wǎng)膜上，然后讓大腦將這些數(shù)據(jù)轉(zhuǎn)換成三維信息。

最近，谷歌的一組研究人員開發(fā)了一種算法，可以將一組照片轉(zhuǎn)換成三維空間(如圖所示)。

我們的學(xué)生和我們的合作伙伴進(jìn)一步創(chuàng)建了一個(gè)可以將一個(gè)輸入圖像轉(zhuǎn)換成三維形狀的算法(如圖所示)。

還記得我們談過的計(jì)算機(jī)程序，可以把人類的句子轉(zhuǎn)換成視頻嗎？密歇根大學(xué)的一組研究人員找到了一種方法，將這句話轉(zhuǎn)換成三維房間設(shè)計(jì)(如圖)。

我在斯坦福的同事和他們的學(xué)生開發(fā)了一種算法，它可以從一張圖片中產(chǎn)生無限可能的空間，供觀眾探索(如圖)。

這些都是未來各種可能的萌芽。一個(gè)可以把我們整個(gè)世界變成數(shù)字的方法，通過建模展示世界豐富而不同的未來。

自然，這些事情都是在我們自己的頭腦中秘密完成的?？臻g智能技術(shù)有望為我們的集體意識(shí)實(shí)現(xiàn)這一點(diǎn)。隨著空間智能的加速發(fā)展，一個(gè)新的良性循環(huán)正在我們面前進(jìn)行。

這種相互作用正在催化機(jī)器人學(xué)習(xí)。這是具體智能系統(tǒng)的關(guān)鍵組成部分，需要理解和與三維世界互動(dòng)。

十年前，我實(shí)驗(yàn)室的ImageNet數(shù)據(jù)庫幫助訓(xùn)練計(jì)算機(jī)，讓它們看得見。現(xiàn)在，我們正在用行為和動(dòng)作來訓(xùn)練計(jì)算機(jī)和機(jī)器人，使它們能夠在三維世界中行動(dòng)。

然而，我們沒有收集靜態(tài)圖像，而是開發(fā)了一個(gè)由三維空間模型驅(qū)動(dòng)的模擬環(huán)境，這樣計(jì)算機(jī)就可以以無限多樣的概率學(xué)習(xí)行動(dòng)。你現(xiàn)在看到的是我實(shí)驗(yàn)室領(lǐng)導(dǎo)的Behavior項(xiàng)目中機(jī)器人學(xué)習(xí)的例子。

我們?cè)跈C(jī)器人語言智能方面也取得了令人興奮的進(jìn)展。我的學(xué)生和合作伙伴是第一批在這方面取得進(jìn)步的團(tuán)隊(duì)?；诖笮驼Z言模型的輸入，他們開發(fā)的機(jī)械臂現(xiàn)在可以根據(jù)口頭指令執(zhí)行各種任務(wù)。

比如打開抽屜或者拔出充電手機(jī)，或者用面包、生菜、西紅柿做三明治，甚至給用戶放紙巾。一般來說，我想在三明治里放更多的材料，但這是一個(gè)好的開始。

未來空間智能有望在醫(yī)療等領(lǐng)域發(fā)揮重要作用。

在古代，在原始的海洋中，看到和感知環(huán)境的能力開啟了寒武紀(jì)大爆發(fā)的帷幕，不同的生活形式開始互動(dòng)?，F(xiàn)在，光輝正在觸摸數(shù)字大腦。

空間智能不僅可以使機(jī)器與其他機(jī)器互動(dòng)，還可以與人類和真實(shí)或虛擬的三維世界互動(dòng)。隨著這種未來逐漸成為現(xiàn)實(shí)，它將對(duì)許多人的生活產(chǎn)生深遠(yuǎn)的影響。

讓我們以醫(yī)療為例。在過去的十年里，我的實(shí)驗(yàn)室一直在使用AI來處理病人預(yù)后不良和醫(yī)護(hù)人員過度勞累的問題。

我們正在與斯坦福醫(yī)學(xué)院和合作醫(yī)院的工作人員合作，試圖使用智能傳感器。這些傳感器可以檢測(cè)醫(yī)護(hù)人員進(jìn)入病房時(shí)是否正確洗手，并在患者處于危險(xiǎn)(如摔倒)時(shí)跟蹤手術(shù)器械或提示護(hù)理團(tuán)隊(duì)。

我們把這些技術(shù)當(dāng)成一種環(huán)境智能，就像一雙額外的眼睛。它們確實(shí)可以起到一些作用。但我希望為我們的病人、醫(yī)護(hù)人員和護(hù)理人員提供更多的互動(dòng)幫助，他們迫切需要一個(gè)真正能做點(diǎn)什么的幫手。

想象一下，如果有一個(gè)可以運(yùn)輸醫(yī)療用品的獨(dú)立機(jī)器人，醫(yī)護(hù)人員只需要致力于患者。通過使用增強(qiáng)現(xiàn)實(shí)技術(shù)，我們還可以引導(dǎo)外科醫(yī)生進(jìn)行更安全、更快、創(chuàng)傷更小的手術(shù)。

想象一下，嚴(yán)重癱瘓的患者通過腦電波控制機(jī)器人來完成我們常見的日常任務(wù)。是的，你可以通過腦電波。在我實(shí)驗(yàn)室最近的一項(xiàng)試點(diǎn)研究中，我們可以看到這種未來的雛形。

在這個(gè)例子中，機(jī)械臂的控制是通過非侵入性腦電帽收集的腦波信號(hào)來實(shí)現(xiàn)的。這個(gè)機(jī)械臂現(xiàn)在正在煮一頓生日快餐。

06.數(shù)字生命寒武紀(jì)大爆發(fā)即將來臨，但必須確保技術(shù)始終以人為本。

五億年前，視覺的出現(xiàn)徹底顛覆了原本黑暗的世界。它開始了一個(gè)影響最深遠(yuǎn)的進(jìn)化過程:動(dòng)物世界中智能化的發(fā)展。

在過去的十年里，AI的驚人進(jìn)步也令人震驚。但我相信，要想充分發(fā)揮數(shù)字寒武紀(jì)大爆發(fā)的潛力，就必須為計(jì)算機(jī)和機(jī)器人提供空間智能。這就是大自然為我們提供的。

這是一個(gè)激動(dòng)人心的時(shí)刻。我們可以教我們的數(shù)字伙伴學(xué)習(xí)推理，教他們與我們稱之為家的三維空間互動(dòng)，帶來更多我們可以探索的新世界。

實(shí)現(xiàn)這一未來并不容易。在付諸行動(dòng)時(shí)，我們需要仔細(xì)考慮，始終以人為本的技術(shù)開發(fā)。

但是，如果我們能夠以正確的方式促進(jìn)技術(shù)的發(fā)展，這些具有空間智能的計(jì)算機(jī)和機(jī)器人不僅會(huì)成為實(shí)用的工具，還會(huì)成為可靠的伙伴，提高和提高我們的生產(chǎn)力，促進(jìn)人類社會(huì)的發(fā)展。他們還尊重人類個(gè)人的尊嚴(yán)，促進(jìn)人類的共同繁榮。

最讓我興奮的是，AI將有更強(qiáng)的理解、洞察和空間感知能力，并與我們一起不懈努力，以更好的方式創(chuàng)造一個(gè)更好的世界。謝謝你。

結(jié)論：空間智能開啟AI發(fā)展新篇章將成為下一代AI的“原爆點(diǎn)”

在九年前的TED演講中，李飛飛介紹了深度學(xué)習(xí)的開始，ImageNet，這也為當(dāng)代AI奠定了基礎(chǔ)?，F(xiàn)在，她再次站在TED的舞臺(tái)上，詮釋了“空間智能”的新概念，引導(dǎo)AI走向更高的水平。

李飛飛本人在很多場(chǎng)合指出，AI領(lǐng)域能獲得的資源太有限了。她呼吁政府為AI探索的發(fā)展提供必要的支持?，F(xiàn)在，李飛飛已經(jīng)暫時(shí)離開象牙塔，最終創(chuàng)業(yè)，并在硅谷著名風(fēng)險(xiǎn)投資公司a16z投資。我們也期待她在學(xué)術(shù)界之外給AI領(lǐng)域帶來新的驚喜。

本文來自微信微信官方賬號(hào)的“智東西”（ID：zhidxcom），作者：陳駿達(dá)，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

康師傅方便面「悄悄」的在漲價(jià)

有多少農(nóng)民工治愈了北京的隔離欄？

深挖霸王茶姬24組核心數(shù)據(jù)，能否超越星巴克？

今年愛上“平替”的年輕人，正在開始“整頓”消費(fèi)市場(chǎng)。

被罵慘的江南步衣，半年賺了5.7億

項(xiàng)目推薦

迪瓜租機(jī)

愛親母嬰連鎖品牌

<li id="8igak"></li>