Agent應用爆發(fā),誰能成為向上托舉的力量?Infra如何擔此重任?
歷經兩年多的發(fā)展,AI正加速邁入Agent時代。
當AI從“被動響應”轉變?yōu)椤爸鲃記Q策”,AI Agent成為連接數字世界與物理世界的關鍵樞紐。
從自動處理客戶服務工單的企業(yè)Agent,到協調多步驟科研實驗的學術Agent,再到管理智能家居生態(tài)的個人Agent,這種具備推理、規(guī)劃、記憶與工具使用能力的智能體,正在重塑產業(yè)形態(tài)。
然而,支撐其智能的是一套復雜且精密的基礎設施,它不僅包含算法與模型,還涵蓋從研發(fā)到部署、從協作到運維的全生命周期支撐體系。
2025年,AI Agentic基礎設施(Agent Infra)迎來爆發(fā)拐點。DeepSeek、Qwen等開源大模型的突破為Agent提供了強大的認知“大腦”,而模型上下文協議(MCP)的生態(tài)繁榮則賦予其靈活“四肢”。
據IDC預測,全球80%企業(yè)將在年內部署Agent。“大腦”與“四肢”的協同進化,正倒逼承載二者的“軀干”全面升級,Agent Infra成為技術攻堅的核心戰(zhàn)場。
Agent企業(yè)應用面臨五大痛點
利用AI能力實現工作流程自動化的產品早已有之。在生成式AI出現之前,RPA類產品就很流行。
但當時AI能力較弱,RPA只能將簡單的單一工作流程自動化,不具備真正的智能,無法解決復合化的復雜問題。
直到生成式AI出現,各種真正具備智能的Agent應用誕生,人們才從AI自動化中獲得顯著的效率提升。
Agent本質是一個能調用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了精巧的工作流,讓AI模型使用不同工具完成復雜任務。
不過,無論是以DeepResearch為代表的研究類Agent應用,還是Manus這樣的通用Agent應用,都是通過網頁或App向終端用戶提供。
這種提供方式不適合專業(yè)的AI開發(fā)者、AI創(chuàng)業(yè)者和企業(yè)用戶。他們需要讓Agent使用專有的數據,無縫嵌入業(yè)務,為業(yè)務持續(xù)創(chuàng)造價值。
商業(yè)化使用Agent,首先會遇到終端性能問題。當功能強大的Agent在用戶本地終端運行時,會出現各種狀況。
首當其沖的是AI推理的算力限制。Agent由強大的AI模型和供其調用的工具鏈組成。運行強大的AI模型通常需要AI專用的算力,由GPU或AI專用芯片提供,消費級的PC或手機幾乎無法部署高精度的大模型本體。因此,目前大量的Agent公司采用云端算力,將模型的訓練和推理都放在云端完成。
其次是執(zhí)行任務的算力問題。Agent任務具有高并發(fā)、高算力需求的特點。企業(yè)在本地部署Agent后,當業(yè)務量快速增長時,馬上需要更多算力,本地部署速度跟不上;而業(yè)務閑置時,又會造成巨大的資源浪費。比如Manus初期用本地服務器的虛擬機做任務,用戶大量涌入時,出現性能不足、服務不穩(wěn)定的情況,影響了初期口碑。
再次是AI工具配置麻煩。Agent若不能調用工具,就難以解決復雜問題。例如搭建銷售類Agent,需要調用CRM獲取客戶信息,調用內部知識庫介紹產品,還需調用通訊工具觸及客戶。國內的智算中心雖能緩解算力限制問題,但只提供算力,不提供搭建Agent所需的工具鏈。企業(yè)要定制與業(yè)務緊密耦合的Agent,需自己搭建工具鏈,這不僅開發(fā)成本高,還會延緩業(yè)務發(fā)展速度。
解決算力限制和AI工具配置問題后,專業(yè)AI開發(fā)者和企業(yè)用戶會遇到權限沖突問題。開發(fā)和部署Agent是為了嵌入業(yè)務,這不僅要調用各種工具,還需與業(yè)務中的軟件緊密配合。以銷售類Agent為例,調用CRM、內部知識庫和通訊工具時,會占用本地計算資源,還會搶占人類員工的訪問和操作權限,可能拉低團隊整體工作效率。
對于企業(yè)用戶,安全性差也是大問題。企業(yè)使用Agent需用公司內部數據,但Agent任務執(zhí)行是個黑盒子,過程不透明,可能對本地電腦文件系統(tǒng)進行修改、刪減等操作,輕則造成系統(tǒng)臃腫,重則導致文件丟失或數據泄露。而且Agent調用工具本身也存在安全隱患。據統(tǒng)計,超43%的MCP服務節(jié)點存在未經驗證的Shell調用路徑,超83%的部署存在MCP配置漏洞,88%的AI組件部署未啟用防護機制。在未來Agent普及的時代,安全和信任比互聯網時代更重要。
企業(yè)真正使用本地部署的Agent后,還會面臨Agent缺乏長期記憶的問題。缺乏語義記憶和場景記憶,Agent只能完成一次性任務,嚴重影響其在企業(yè)業(yè)務中的使用范圍。若能賦予Agent長期記憶,它不僅能完成多次任務,企業(yè)還可根據記憶迭代Agent,使其能力不斷增強。
Agent Infra乘風而來
如今,云廠商紛紛推出新一代Agent Infra技術架構。
比如AWS推出AgentCore(預覽版),基于Lambda FaaS基礎設施深度定制和優(yōu)化的全托管運行時,為Bedrock Agents解決了標準Lambda的關鍵限制,如長時執(zhí)行、狀態(tài)記錄、會話隔離等。
Azure推出AI Foundry Agent Service,集成Functions FaaS事件驅動,使Agent Service能利用Serverless計算的優(yōu)勢,更輕松地構建和部署Agent。
Google Cloud推出Vertex AI Agent Builder,雖官方未明確,但普遍推斷其高度依賴并優(yōu)化了Cloud Run來支撐長時運行、并發(fā)和有狀態(tài)的需求。
阿里云推出函數計算Function AI,基于FC FaaS的Serverless x AI運行時深度優(yōu)化,推出模型服務、工具服務、Agent服務,開發(fā)者可自主選擇模型、運行時、工具的一個或多個以組裝式設計構建和部署Agent。
PPIO推出國內首個Agentic AI基礎設施服務平臺——AI智能體,該平臺產品分為通用版和企業(yè)版。通用版以分布式GPU云底座為支撐,發(fā)布中國首款兼容E2B接口的Agent沙箱,以及更適用于Agent構建的模型服務。Agent沙箱是專為Agent執(zhí)行任務設計的云端安全運行環(huán)境,支持動態(tài)調用各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”,目前已接入Camel AI、OpenManus、Dify等著名開源項目。
這些技術的目標一致,即為Agent提供更高彈性、更低延遲、更強安全、更長會話的“軀干”,支撐其從實驗室走向千萬級企業(yè)場景。當認知與行動形成閉環(huán),Agent Infra的技術代差將決定企業(yè)AI創(chuàng)新和轉型的落地速度與質量。
Agent開發(fā)范式的演進對底層基礎設施提出了新要求。各大云廠商的新一代Agent Infra聚焦長時運行、會話親和、會話隔離、企業(yè)級IAM和VPC及模型/框架開放等技術突破,以滿足三類核心Agent形態(tài)的共性需求。
首先是LLM Agent連續(xù)調用工具的強訴求。LLM Agent需連續(xù)調用工具鏈完成復雜推理,可能耗時數分鐘甚至數小時。傳統(tǒng)Serverless的執(zhí)行時長限制會強制中斷任務,因此新一代Agent Infra必須突破該限制,支持長時運行。同時,為維持多輪對話的上下文一致性,需會話親和確保同一請求路由到同一計算實例,避免狀態(tài)丟失。
其次,Workflow Agent對狀態(tài)管理的依賴。自動化工作流需持久化記錄執(zhí)行狀態(tài)。傳統(tǒng)Serverless的無狀態(tài)特性無法保存中間結果,而新一代Agent Infra通過提供有狀態(tài)會話保障工作流的原子性和可恢復性。會話隔離則確保多租戶或高并發(fā)場景下任務互不干擾,滿足企業(yè)級安全合規(guī)要求。
第三,Custom Agent的靈活性與生態(tài)整合。Custom Agent需集成異構工具,要求新一代Agent Infra支持模型/框架開放。封閉式架構會限制Agent能力擴展,云廠商通過解耦計算層與框架層,可提供插件化集成接口。
新一代Agent Infra保留了Serverless的核心優(yōu)勢,通過關鍵功能和技術突破,解決了LLM Agent、Workflow Agent和Custom Agent的核心需求。這標志著Agent開發(fā)正從“手動拼湊傳統(tǒng)組件”轉向“利用原生Infra實現高效、安全、可擴展的開發(fā)部署”的新路徑。
隨著Agent應用加速發(fā)展,Agent Infra成為模型公司、云廠商、初創(chuàng)公司積極拓展的領域。除云巨頭外,創(chuàng)業(yè)公司也有機會。一是在已有Infra中尋找有AI - native需求的環(huán)節(jié),如提高Sandbox的冷啟動速度和隔離性,或增加與AI workflow結合的功能點。二是抓住Agent開發(fā)中的新痛點,開發(fā)易用性高且價格合理的Infra產品,推動Agent生態(tài)的構建。
當開發(fā)Agent變得像組裝樂高積木一樣簡單,當Agent協作網絡遍布社會各個角落,我們將不再爭論“這是風口還是泡沫”,因為這是即將到來的新未來。
本文來自微信公眾號“科技云報道”(ID:ITCloud - BD),作者:科技云報到,36氪經授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com