亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<abbr id="bq4vf"><th id="bq4vf"></th></abbr>

英偉達(dá)帶火的“具身智能”是什么？AI價(jià)值遠(yuǎn)比機(jī)器人更大

商界觀察

2023-05-22

近日，“具身智能”概念被英偉達(dá)創(chuàng)始人CEO黃仁勛帶火。

華爾街見(jiàn)聞·見(jiàn)智研究（公眾號(hào)：見(jiàn)智研究Pro）認(rèn)為，具身智能帶來(lái)的AI價(jià)值遠(yuǎn)比人形機(jī)器人更大。

具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界，用擬人化的思維路徑去學(xué)習(xí)，從而做出人類期待的行為反饋，而不是被動(dòng)的等待數(shù)據(jù)投喂。

在人類的五大感官中視覺(jué)獲取的信息占比超過(guò)80%，并且讓機(jī)器理解人類語(yǔ)言也是非常重要的，所以機(jī)器視覺(jué)和多模態(tài)大模型正是開(kāi)啟機(jī)器自我感知學(xué)習(xí)的兩把鑰匙。

01 具身智能是什么？

具身智能簡(jiǎn)單來(lái)說(shuō)就是AI的大腦加上軀體。

它能夠跟我們生活的環(huán)境進(jìn)行交互，從而展現(xiàn)出智能行為。

具身智能為什么被看作AI的iPhone時(shí)刻？

原來(lái)的人工智能可以看作第三人稱的智能，也就是投喂數(shù)據(jù)給機(jī)器，讓它學(xué)習(xí)什么它就學(xué)習(xí)什么。

而現(xiàn)在具身智創(chuàng)造了一種機(jī)器自主學(xué)習(xí)的新方式，能夠以第一人稱的視角來(lái)感知和學(xué)習(xí)物理世界，并像人類一樣理解和感知事物的能力，才能在此基礎(chǔ)上進(jìn)行相同思維的發(fā)展，最后表現(xiàn)出人類期待的行為方式。

Windows為何能統(tǒng)治操作系統(tǒng)，iPhone為何創(chuàng)造智能手機(jī)時(shí)代，最重要的原因就是他們創(chuàng)造了最簡(jiǎn)單、最直觀的人機(jī)交互窗口。

發(fā)展人工智能的意義在于能夠讓機(jī)器造福人類，協(xié)助處理事務(wù)，提高生產(chǎn)力；更進(jìn)一步則是讓AI進(jìn)行創(chuàng)造，推動(dòng)科學(xué)研究的進(jìn)展。

而這一切的前提是：要讓機(jī)器理解人類社會(huì)，要做到這一點(diǎn)，需要的就是具身智能。

見(jiàn)智研究認(rèn)為，讓AI擬人化的進(jìn)行感知和理解世界方式，視覺(jué)和聽(tīng)覺(jué)是非常重要的。

看見(jiàn)并理解物理世界中存在的事物，并且能夠聽(tīng)懂人類的語(yǔ)言這背后需要的是機(jī)器視覺(jué)技術(shù)和多模態(tài)大模型。

在具身智能領(lǐng)域的快速發(fā)展下，這兩大領(lǐng)域的技術(shù)創(chuàng)新和需求也會(huì)與日俱增。

02 具身智能比人形機(jī)器人更有價(jià)值

具身智能相當(dāng)于AI的大腦，而這個(gè)大腦的載體可以是任何形式。可以是一個(gè)機(jī)械臂，一只機(jī)器狗，更或者是一輛小汽車。

而反觀人形機(jī)器人，當(dāng)下為何被看做是一個(gè)不太聰明的鋼鐵巨人，核心還是因?yàn)槿鄙貯I大腦+不太靈活的軀體。

就像馬斯克所表示的，雖然未來(lái)有一天人人可能會(huì)擁有一個(gè)人形機(jī)器人，但是目前展現(xiàn)的Optimus人形機(jī)器人產(chǎn)品也就只能執(zhí)行重復(fù)性的簡(jiǎn)單勞動(dòng)。

見(jiàn)智研究認(rèn)為，我們真正需要的人形機(jī)器人目前還缺少具身智能特質(zhì)。

馬斯克也表示：未來(lái)會(huì)將特斯拉的視覺(jué)技術(shù)用于人形機(jī)器人的研發(fā)中。

而對(duì)于具身智能和人形機(jī)器人所能夠創(chuàng)造的價(jià)值，也非常明了了。具身智能的應(yīng)用場(chǎng)景沒(méi)有局限性，所以市場(chǎng)空間更廣闊。

03 關(guān)注具身智能的硬實(shí)力

具身智能的硬實(shí)力包括：機(jī)器視覺(jué)和多模態(tài)大模型。

機(jī)器視覺(jué)是AI的感知工具，亦為數(shù)據(jù)生產(chǎn)的手段。在人類的五大感官中視覺(jué)獲取的信息占比超過(guò) 80%。

機(jī)器視覺(jué)的端口是攝像頭，作為看懂世界的“眼睛”；機(jī)器視覺(jué)的大腦是算法，承擔(dān)分析功能。

見(jiàn)智研究認(rèn)為，相比于單純迭代硬件的參數(shù)指標(biāo)，算法和架構(gòu)的升級(jí)對(duì)于AI來(lái)說(shuō)更重要。因?yàn)閿z像頭的發(fā)展目前已經(jīng)可以實(shí)現(xiàn)對(duì)物體的數(shù)據(jù)采集，無(wú)論是清晰度還是色彩度都已經(jīng)卷到了夠用的程度。

值得關(guān)注的是，多模態(tài)大模型在機(jī)器領(lǐng)域的應(yīng)用。無(wú)論是視覺(jué)圖像信號(hào)還是人類語(yǔ)言的聲音信號(hào)，最后都要轉(zhuǎn)化為機(jī)器能夠理解的語(yǔ)言，從而實(shí)現(xiàn)人機(jī)交互的目的。

從現(xiàn)階段應(yīng)用來(lái)看，目前最好的是谷歌的PaLM-E大模型（參數(shù)5620億），可以將視覺(jué)和語(yǔ)言同時(shí)集成到機(jī)器人的控制中。

這種大模型最大程度的解決了需要人工對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和注釋的繁瑣流程，極大提高了機(jī)器理解的效率。

通過(guò)將PaLM-E大模型集成到控制中，能夠直接通過(guò)攝像頭的數(shù)據(jù)實(shí)現(xiàn)對(duì)機(jī)器執(zhí)行命令，并且具備一定程度的抗干擾能力。

小結(jié)

AI的軀體其實(shí)并非是最重要的。

核心應(yīng)該是發(fā)展AI大腦，打通人機(jī)交互方式，讓AI能夠主動(dòng)感知物理世界，擬人化的思維路徑才能做到人類期待的行為反饋。

機(jī)器視覺(jué)和多模態(tài)大模型正是開(kāi)啟這個(gè)世界的兩把鑰匙。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

李彥宏：AI 取代不了人，昆侖芯第三代明年上市

獲客、增長(zhǎng)、留存，東南亞SaaS市場(chǎng)怎么闖？

野營(yíng)地購(gòu)買車載冰箱為了不踩雷，請(qǐng)注意這些參數(shù)。

ChatGPT通過(guò)美放射學(xué)委員會(huì)考試

科大訊飛劉慶峰：訊飛星火大模型10月實(shí)現(xiàn)中文超越ChatGPT

項(xiàng)目推薦

<track id="wsnz4"><th id="wsnz4"></th></track>

<ul id="wsnz4"><kbd id="wsnz4"></kbd></ul>

<address id="wsnz4"><tt id="wsnz4"></tt></address>