亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

AI時(shí)代新風(fēng)口,吳恩達(dá)親授智能體四大設(shè)計(jì)模式

2024-04-24

吳恩達(dá)認(rèn)為,智能體的發(fā)展將成為AI時(shí)代的重要力量,甚至比基本模型更重要。下班后,「吳老師」連續(xù)發(fā)布多個(gè)博客,向大家介紹了AI智能體的四種設(shè)計(jì)模式。



AI時(shí)代的風(fēng)口在哪里?


吳恩達(dá)認(rèn)為,AI 今年,Agent將推動(dòng)人工智能的大規(guī)模進(jìn)步。


——即使是下一代基礎(chǔ)模型也有可能產(chǎn)生影響。


他希望所有從事人工智能工作的人都能關(guān)注AI智能體的發(fā)展。


Andrew Ng


大佬「退伍」之后,作為專業(yè)人士「教書先生」,依然孜孜不倦,授業(yè)傳道解惑。


最近,在業(yè)余時(shí)間,吳恩達(dá)繼續(xù)分享許多關(guān)于智能體的意見(jiàn),并定義了AI。 四種Agent設(shè)計(jì)模式,


Reflection(反思)、Tool use(使用工具)、Planning(計(jì)劃)和Multi-agent collaboration(多智能體協(xié)同):


-反?。篖LM檢查自己的工作,并提出改進(jìn)的方法。


-使用工具:LLM利用Web搜索、代碼執(zhí)行或任何其它功能的工具,幫助自己收集信息,付諸行動(dòng)或處理數(shù)據(jù)。


-計(jì)劃:LLM提出并實(shí)施多步計(jì)劃來(lái)實(shí)現(xiàn)目標(biāo)(比如一篇論文,先寫大綱,然后搜索研究各部分內(nèi)容,再寫稿子)。


-多個(gè)AI體合作:多個(gè)AI體合作 與單個(gè)智能體相比,agent協(xié)調(diào)工作、分工任務(wù)、討論和辯論思路提出了更好的解決方案。



智能體工作流程


大多數(shù)人使用LLM通常是zero-shot方法,模型根據(jù)需要逐個(gè)導(dǎo)出token,沒(méi)有回到修改的機(jī)會(huì)。


——這相當(dāng)于要求人類從頭到尾一口氣寫完一篇文章,不能回頭?!m然這是一個(gè)艱難的要求,但大模型目前做得非常好。



但是事實(shí)上,我們?nèi)祟愓5墓ぷ髁鞒掏ǔJ堑摹?/p>


例如,對(duì)于一篇文章,可能需要:


計(jì)劃一個(gè)大綱;通過(guò)網(wǎng)絡(luò)搜索收集更多信息;


寫原稿;


閱讀原稿,發(fā)現(xiàn)不合理的論點(diǎn)或不相關(guān)的信息;


反復(fù)修改...



這樣的工作方法對(duì)人類寫好文章尤為重要,-那么對(duì)AI來(lái)說(shuō),是否也應(yīng)該如此?


不久前,世界上第一位AI程序員Devin的演示,在社交平臺(tái)上引起了轟動(dòng)。


因此,吳恩達(dá)團(tuán)隊(duì)對(duì)HumanEval編碼基準(zhǔn)測(cè)試中的多種算法進(jìn)行了研究,如圖所示:


在zero 在shot情況下,GPT-3.5的正確率為48.1%,GPT-4表現(xiàn)更好,達(dá)到67.0%。


但是,在加入了智能體迭代工作流程之后,GPT-與GPT-3.5相比,3.5的正確率直接飆升到95.1%,-Agent的工作流效果顯著,GPT-3.5的提升更為令人印象深刻。


現(xiàn)在,各種開(kāi)源智能體工具相關(guān)研究的總數(shù)正在飆升,善于使用這些工具和經(jīng)驗(yàn),會(huì)使你的LLM更強(qiáng)大。


Reflection

反省,作為一種易于快速實(shí)現(xiàn)的設(shè)計(jì)模式,已經(jīng)帶來(lái)了令人驚訝的性能影響。


在LLM中,我們可能有過(guò)這樣的經(jīng)歷:( ChatGPT/Claude當(dāng)給出的結(jié)果不盡如人意時(shí),我們可以提供一些反饋,當(dāng)LLM再次導(dǎo)出時(shí),我們可以給出更好的反饋。


——如果LLM自己執(zhí)行這個(gè)反饋過(guò)程,會(huì)不會(huì)更好?這就是反思。(Reflection)。



以編碼任務(wù)為例,LLM可以通過(guò)類似的提示反思自己的導(dǎo)出:


它是用來(lái)完成任務(wù)的 X 代碼,仔細(xì)檢查代碼的準(zhǔn)確性、風(fēng)格和質(zhì)量,并就如何改進(jìn)它提出建設(shè)性的指責(zé)。



下一步,將之前產(chǎn)生的代碼和反饋放入提示的前后文本中,并要求LLM根據(jù)反饋重寫代碼。


當(dāng)然,我們也可以使用一些工具來(lái)評(píng)估LLM的導(dǎo)出質(zhì)量,使上述過(guò)程更加進(jìn)一步,


例如,通過(guò)單元測(cè)試來(lái)檢查代碼在功能測(cè)試中的結(jié)果,或通過(guò)web搜索來(lái)檢查導(dǎo)出的準(zhǔn)確性。


另外,還可以使用多智能體框架來(lái)實(shí)現(xiàn)Reflection,如上圖所示。:一方負(fù)責(zé)生成導(dǎo)出,另一方面重點(diǎn)是對(duì)導(dǎo)出提出建議。


假如你對(duì)Reflection感興趣,這里推薦以下文章,可以提供更多的相關(guān)知識(shí):


論文地址:https://arxiv.org/pdf/2303.17651.pdf



論文地址:https://arxiv.org/pdf/2303.11366.pdf


論文地址:https://arxiv.org/pdf/2305.11738.pdf


Tool Use

使用工具時(shí),LLM可以調(diào)用給定的函數(shù)來(lái)收集信息、付諸行動(dòng)或操作數(shù)據(jù),這是AI智能體工作流程的關(guān)鍵設(shè)計(jì)模式。


最常見(jiàn)的例子是LLM可以使用工具來(lái)執(zhí)行Web搜索或代碼執(zhí)行。事實(shí)上,一些面向消費(fèi)者的大企業(yè)已經(jīng)使用了這個(gè)功能。


比如你問(wèn)Copilot這樣的在線LLM?:「哪個(gè)是最好的咖啡機(jī)?」,它可以決定進(jìn)行網(wǎng)絡(luò)搜索,并且下載一個(gè)或多個(gè)網(wǎng)頁(yè)以獲得前后文本。


歸根結(jié)底,僅僅依靠預(yù)訓(xùn)練的Transformer來(lái)生成導(dǎo)出答案是有限的,而提供Web搜索工具可以使LLM做得更多。


LLM使用特殊的字符串,例如 {tool:web-search,query:coffee maker reviews} ,要求調(diào)用搜索引擎。


后處理步驟將查找字符串,調(diào)用具有相關(guān)參數(shù)的Web搜索函數(shù),并將結(jié)果添加到輸入前后文本中,并將其傳輸回LLM。


例如,如果你問(wèn),「假如我在12年內(nèi)獲得7%的復(fù)利,投資100美元,最終會(huì)獲得多少收益?」,


使用代碼執(zhí)行工具,運(yùn)行Python指令,LLM可以計(jì)算:{tool:python-interpreter,code:100 *(1 **12}0.07。


現(xiàn)在這個(gè)過(guò)程更接近一步,我們可以搜索不同的源頭。(Web、Wikipedia、與各種生產(chǎn)力工具(發(fā)送電子郵件、閱讀/寫日歷內(nèi)容等)進(jìn)行交互。),并希望LLM自動(dòng)選擇合適的函數(shù)調(diào)用來(lái)完成工作。


另外,當(dāng)有太多的函數(shù)可以使用時(shí),所有的函數(shù)都不能放在前后的文本中。此時(shí),可以使用啟發(fā)方法,選擇LLM前后文本中最相關(guān)的子集。


事實(shí)上,當(dāng)有太多的文本不能作為前后文本包含時(shí),檢索增強(qiáng)生成。(RAG)該系統(tǒng)還采用相同的方法,選擇要包含的文本子集。


這里還推薦幾篇相關(guān)文章:


論文地址:https://arxiv.org/pdf/2305.15334.pdf


論文地址:https://arxiv.org/pdf/2303.11381.pdf


論文地址:https://arxiv.org/pdf/2401.17464.pdf


Planning

計(jì)劃,利用LLM將目標(biāo)任務(wù)分解成較小的子任務(wù),然后獨(dú)立決定執(zhí)行過(guò)程。


例如,如果我們要求智能體在線研究給定的主題,LLM可以將其拆解為特定的子主題,綜合發(fā)現(xiàn),編寫報(bào)告。



曾經(jīng),ChatGPT的發(fā)布讓很多人經(jīng)歷過(guò)?!窩hatGPT時(shí)刻」,人工智能的能力遠(yuǎn)遠(yuǎn)超出了每個(gè)人的預(yù)期。


——而相似的「AI Agent時(shí)刻」,也許很快就會(huì)到來(lái)。


吳恩達(dá)回憶起之前的一次現(xiàn)場(chǎng)展覽,由于網(wǎng)速問(wèn)題,Agent的Web搜索API回歸了錯(cuò)誤,——Agent實(shí)際上轉(zhuǎn)向了維基百科的搜索工具,最終完成了任務(wù)(救了大命)。


吳恩達(dá)說(shuō),看到Agent以意想不到的方式完成任務(wù)并取得成功是一件美好的事情。


但也有網(wǎng)友表示,大事不好啦,Agent失控了!


事實(shí)上,有許多任務(wù)不能通過(guò)單一步驟或單一工具來(lái)完成,但是Agent可以決定要執(zhí)行哪些步驟。


例如,要求智能體參考一張男孩的照片,畫一張同樣姿勢(shì)的女孩的照片,這個(gè)任務(wù)可以分為兩個(gè)步驟:(i)檢查男孩照片中的姿勢(shì),(ii)用檢測(cè)到的姿勢(shì)渲染女孩的照片。


LLM可能會(huì)導(dǎo)出類似的導(dǎo)出。 {tool:pose-detection,input:image.jpg,output:temp1 } {tool:pose-to-image,input:temp1,output:final.jpg} 這種字符串可以指定計(jì)劃。


Planning是一種很強(qiáng)的能力,但它也會(huì)產(chǎn)生意想不到的結(jié)果。


吳恩達(dá)說(shuō),Planning仍然是一項(xiàng)不成熟的技術(shù),客戶很難提前預(yù)測(cè)它會(huì)做什么,但我們可以期待技術(shù)的不斷發(fā)展來(lái)解決這個(gè)問(wèn)題。


此處還推薦3項(xiàng)相關(guān)優(yōu)秀工作:



論文地址:https://arxiv.org/pdf/2201.11903.pdf



論文地址:https://arxiv.org/pdf/2303.17580.pdf



論文地址:https://arxiv.org/pdf/2402.02716.pdf


參考資料

https://twitter.com/AndrewYNg/status/1779606380665803144


本文來(lái)自微信微信官方賬號(hào)“新智元”(ID:AI_era),作者:alan,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com