世界上第一個AI智能體「自進(jìn)化」開源框架來了,一次安排,終身可用。
【簡介】多AI智能系統(tǒng)的復(fù)雜構(gòu)建和優(yōu)化,長期以來一直是智能體處理科研問題和場景落地的瓶頸。英國格拉斯哥大學(xué)的研究團(tuán)隊發(fā)布了世界上第一個AI智能體自進(jìn)化開源框架EvoAgentX,通過引入自我進(jìn)化機(jī)制,打破了傳統(tǒng)多智能系統(tǒng)在建立和優(yōu)化中的局限性!
如今,隨著語言模型技術(shù)的快速發(fā)展,各種AI智能體在科研和工業(yè)場景中得到了廣泛的應(yīng)用。然而,在實際應(yīng)用中,構(gòu)建一個高效穩(wěn)定的多智能系統(tǒng)仍然面臨許多挑戰(zhàn):從智能體選擇、提示詞調(diào)整到工作流設(shè)計,流程復(fù)雜,成本高。
更為重要的是,目前多智能系統(tǒng)一般都是「布署即固化」,缺少自我演變機(jī)制。
在調(diào)整目標(biāo)時,開發(fā)人員通常需要手動修改提示詞,重構(gòu)系統(tǒng)結(jié)構(gòu),陷入困境「建筑-調(diào)整-重構(gòu)」低效率循環(huán),嚴(yán)重制約了智能系統(tǒng)的大規(guī)模落地。

項目地址:https://github.com/EvoAgentX/EvoAgentX
文檔鏈接: https://evoagentx.github.io/EvoAgentX
EvoAgentX推出了世界上第一個AI智能體自進(jìn)化開源框架,針對目前多智能系統(tǒng)應(yīng)用建設(shè)和升級過程中存在的問題!
支持一鍵建設(shè)工作流程,用戶只需提供任務(wù)目標(biāo)或場景描述,系統(tǒng)就可以自動完成智能體配置和工作流程建設(shè)。
與此同時,EvoAgentX引入「自進(jìn)化」機(jī)制,促使多智能系統(tǒng)根據(jù)環(huán)境和目標(biāo)的變化,在實際運(yùn)行中不斷優(yōu)化系統(tǒng)結(jié)構(gòu)和綜合性能。
開源平臺旨在為研究者和工程師提供統(tǒng)一的實驗和土壤部署,促進(jìn)多智能系統(tǒng)從靜態(tài)設(shè)計向動態(tài)演變,促進(jìn)AI多智能系統(tǒng)從「人工調(diào)節(jié)」邁向「自主進(jìn)化」的新范式。
框架介紹
EvoAgentX是一個以自我進(jìn)化為主導(dǎo)的開源AI智能體研究框架,旨在構(gòu)建一個開放、可進(jìn)化的智能體生態(tài),旨在探索具有自我優(yōu)化能力的多智能系統(tǒng)。
項目亮點(diǎn)
EvoAgentX旨在打破當(dāng)前多智能系統(tǒng)建設(shè)和優(yōu)化的堡壘,從三個方面切入關(guān)鍵問題:自動化建設(shè) 自進(jìn)化機(jī)制 系統(tǒng)評價。
EvoAgentX通過整合建模、執(zhí)行和反饋鏈接,不僅使智能系統(tǒng)的構(gòu)建更輕、更快,而且為其進(jìn)化能力奠定了基礎(chǔ)。無論是科研探索還是原型開發(fā),都可以作為核心工具鏈,幫助用戶高效驗證戰(zhàn)略設(shè)計和協(xié)同機(jī)制,加快多智能體能力「可用」邁向「可靠」。

智能體自動構(gòu)建一句話:告別繁瑣的手工設(shè)計
困擾:建立一個高效的多智能體工作流通常需要專業(yè)知識、復(fù)雜的設(shè)備和大量的人工控制,建造過程費(fèi)時費(fèi)力。
EvoAgentX方案:提供任務(wù)驅(qū)動的一鍵工作流生成能力,自動拆解任務(wù),智能體配置和交互建模,顯著降低系統(tǒng)建設(shè)門檻,加快實驗驗證和原型開發(fā)。
智能合作體不斷自我進(jìn)化:讓系統(tǒng)「越用越強(qiáng)」
困擾:一旦建立了傳統(tǒng)的多智能系統(tǒng),就很難不斷優(yōu)化,不能靈活適應(yīng)新的任務(wù)或變化的運(yùn)行環(huán)境,嚴(yán)重依賴人工調(diào)節(jié)。
EvoAgentX方案:多維進(jìn)化算法集成智能體提示詞、工作流結(jié)構(gòu)和記憶機(jī)制,實現(xiàn)AI智能體的不斷自我提升,提高長期適應(yīng)性和協(xié)同效率。
環(huán)境自動評估及反饋:靈活對接任務(wù)情景提供量化反饋
困擾:由于缺乏統(tǒng)一的評估機(jī)制,系統(tǒng)性能難以量化,升級方向不明確,實驗結(jié)論難以復(fù)制和比較。
EvoAgentX方案:內(nèi)置標(biāo)準(zhǔn)任務(wù)環(huán)境和評估指標(biāo),支持量化分析多智能系統(tǒng)性能,支持MCP對接情景工具實現(xiàn)垂直環(huán)境交互和快速反饋,為系統(tǒng)優(yōu)化和科研實驗提供一致可重現(xiàn)的檢測標(biāo)準(zhǔn)。
自動化建設(shè)工作流展示
通過兩個具有代表性的應(yīng)用領(lǐng)域,研究人員系統(tǒng)地展示了EvoAgentX在構(gòu)建多智能體工作流自動化方面的優(yōu)勢和適用性:
情景1:根據(jù)應(yīng)聘者的PDF簡歷內(nèi)容,從網(wǎng)上搜索并推薦匹配的職位信息

情景2:可視化分析a股股票

自我進(jìn)化性能驗證
EvoAgentX選擇了三個有代表性的AI任務(wù)數(shù)據(jù),包括多跳問答,以驗證不同任務(wù)場景下的自我進(jìn)化能力。(HotPotQA),代碼生成(MBPP)和數(shù)學(xué)推理(MATH)。
在這些任務(wù)中,EvoAgentX從提示詞生成策略和工作流結(jié)構(gòu)設(shè)備兩個方面繼續(xù)迭代優(yōu)化系統(tǒng)性能,基于預(yù)設(shè)的初始智能系統(tǒng),結(jié)合其自進(jìn)化機(jī)制。
在推廣過程中,智能體可以基于大語言模型。(LLM)反饋及任務(wù)執(zhí)行結(jié)果,動態(tài)管理提示內(nèi)容及工作流拓?fù)浣Y(jié)構(gòu),實現(xiàn)閉環(huán)自我完善。
提升前后系統(tǒng)在各項任務(wù)中的表現(xiàn)如圖所示,清晰地展示了自進(jìn)化機(jī)制在提高智能系統(tǒng)整體效率方面的作用。

測試數(shù)據(jù)顯示,EvoAgentX 在多跳問答(HotPotQA)、代碼生成(MBPP)和數(shù)學(xué)推理(MATH)三類有代表性的任務(wù)都實現(xiàn)了穩(wěn)定而顯著的性能提升,平均提升幅度高達(dá) 8%~13%
這個結(jié)果不僅證實了它在跨任務(wù)場景中進(jìn)化機(jī)制的普遍適應(yīng)性,而且進(jìn)一步證實了它 EvoAgentX 建立一個可持續(xù)優(yōu)化的多智能系統(tǒng),顯示出強(qiáng)大的泛化能力和工程實用價值。
值得一提的是,目前的優(yōu)化還沒有充分利用框架的所有潛力。隨著未來戰(zhàn)略優(yōu)化、模塊拓展和生態(tài)協(xié)作能力的不斷增強(qiáng),EvoAgentX仍然有著廣闊的性能提升和應(yīng)用拓展空間。
實踐應(yīng)用
為進(jìn)一步驗證 EvoAgentX 該框架還提升了GAIA基準(zhǔn)測試中現(xiàn)有的多智能系統(tǒng),具有優(yōu)化當(dāng)前AI智能體工作流的優(yōu)勢,涵蓋了GAIA排行榜中開源和可再現(xiàn)的代表性多智能系統(tǒng)框架:Open Deep Research
這個框架是由Huggingface團(tuán)隊開發(fā)的一個多智能系統(tǒng),可以實時在線搜索和回答問題。EvoAgentX基于這些智能體的原始結(jié)構(gòu),自動優(yōu)化其提示。
GAIA基準(zhǔn)測試驗證集優(yōu)化后的性能如圖所示:

根據(jù)優(yōu)化后的實驗數(shù)據(jù),EvoAgentX可以在不同的基礎(chǔ)系統(tǒng)中帶來穩(wěn)定顯著的性能提升,進(jìn)一步驗證了該框架在提高當(dāng)前智能體通用性和任務(wù)適應(yīng)性方面的實際效用。

完整的報告和實驗細(xì)節(jié):https://github.com/eax6/smolagents
框架架構(gòu)
EvoAgentX構(gòu)建了一個由多個功能層組成的模塊化結(jié)構(gòu),包括從AI智能體的底層部件到進(jìn)化系統(tǒng)的完整鏈接,以支持AI智能體的不斷優(yōu)化和自我演變。該系統(tǒng)的整體結(jié)構(gòu)如下:

總共包括EvoAgentX的結(jié)構(gòu):
基本組件層:提供基礎(chǔ)模塊、日志管理等框架運(yùn)行的通用能力支持,確保系統(tǒng)具有良好的適用性和可擴(kuò)展性。
智能體層:用于定義AI智能體的核心功能和外部交互能力,包括構(gòu)建AI智能體的關(guān)鍵模塊,包括大語言模型、記憶模塊、動作執(zhí)行部件等。
工作流層:構(gòu)建和管理一個面向復(fù)雜任務(wù)的多智能系統(tǒng),包括工作流圖、智能體管理等部件,適用于多階段、多任務(wù)、多角色的智能體任務(wù)。
進(jìn)化層:專注于AI智能系統(tǒng)的優(yōu)化功能,為智能體提示、工作流結(jié)構(gòu)和記憶機(jī)制提供多維優(yōu)化器,幫助AI智能體的不斷進(jìn)化。
評定層:為AI智能系統(tǒng)提供靈活的性能評估機(jī)制,支持可定量評估AI智能系統(tǒng)的有效性和泛化性。
期望和愿景
EvoAgentX團(tuán)隊認(rèn)為,AI不應(yīng)該依賴于復(fù)雜的人工控制,而應(yīng)該是可能的。自我感知需求、動態(tài)規(guī)劃目標(biāo)、持續(xù)迭代策略智能伙伴。
該團(tuán)隊致力于構(gòu)建一個真正具有自主進(jìn)化的AI智能體生態(tài)系統(tǒng)。
在這個生態(tài)中,每個智能身體都有能力根據(jù)任務(wù)自動構(gòu)建和改進(jìn)工作流程和策略,并通過開放協(xié)議實現(xiàn)經(jīng)驗和知識的全局共享。
EvoAgentX將通過開源社區(qū)的協(xié)同進(jìn)化機(jī)制,重新定義AI系統(tǒng)的開發(fā)模式:開發(fā)者可以自主生成實施并持續(xù)優(yōu)化方案,無需從零開始構(gòu)建復(fù)雜的工作流程,只需給出目標(biāo);科研客戶可以實時獲得生態(tài)學(xué)中最新進(jìn)化的智能體能,而不受靜態(tài)AI模型的限制。
這種「需求是指令,使用是進(jìn)化?!雇ㄟ^這種方式,每個參與者的實踐反饋將加速智能體的智能增長,突破當(dāng)前AI系統(tǒng)的能力邊界,使智能體能夠獨(dú)立拆解復(fù)雜問題,動態(tài)重組技能模塊,并繼續(xù)反饋學(xué)習(xí)。
它是通往可持續(xù)智能未來的唯一途徑:自進(jìn)化AI智能體的使用越聰明,共享越強(qiáng)大,最終將成為賦能各行業(yè)創(chuàng)新的進(jìn)化引擎。
將來里程碑
EvoAgentX將逐步推進(jìn)以下關(guān)鍵里程碑,以實現(xiàn)上述愿景:
階段一: 工作流自動構(gòu)建和模塊化部件集成
構(gòu)建和持續(xù)優(yōu)化一鍵生成多智能體工作流功能;
AI智能體模塊集成典型任務(wù)模板;
提供可視化的工作流圖結(jié)構(gòu)展示和編輯界面;
為了支持快速器重和復(fù)合任務(wù)的構(gòu)建,不斷擴(kuò)展開源組件庫。
第二階段:多維自進(jìn)化能力和反饋學(xué)習(xí)機(jī)制
AI智能體自進(jìn)化算法集成提示詞、工作流結(jié)構(gòu)、記憶模塊等維度。
引入性能反饋驅(qū)動的戰(zhàn)略優(yōu)化機(jī)制
在多項任務(wù)執(zhí)行中,支持系統(tǒng)進(jìn)行自適應(yīng)提升。
提供任務(wù)間遷移能力和進(jìn)化路徑記錄機(jī)制
第三階段:開放智能體生態(tài)與協(xié)同進(jìn)化機(jī)制
為開發(fā)者和研究者構(gòu)建智能體和工作流。「市場」,支持高質(zhì)量的智能體模塊上傳、共享和復(fù)用,提升工作流程。
支持用戶將當(dāng)?shù)赝茝V結(jié)果(如優(yōu)化提示、結(jié)構(gòu)設(shè)備、策略方案)上傳到生態(tài)系統(tǒng),實現(xiàn)系統(tǒng)級協(xié)同進(jìn)化。
建立跨任務(wù)、跨客戶的進(jìn)化軌跡跟蹤和知識融合機(jī)制,讓每一次實踐反饋都能反饋整個生態(tài)系統(tǒng)。
設(shè)計開放協(xié)議和標(biāo)準(zhǔn)界面,促進(jìn)智能體能共享和經(jīng)驗遷移的生態(tài)循環(huán)。
參考資料:
https://github.com/EvoAgentX/EvoAgentX
本文來自微信微信官方賬號“新智元”,編輯:LRST 好困,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




