OpenAI總裁揭秘GPT - 5推理范式變革,計算成AGI實現(xiàn)關鍵
OpenAI的AGI發(fā)展路徑,總裁Greg Brockman在最新訪談中清晰闡述。
技術上,從文本生成轉向強化學習的推理范式,在現(xiàn)實世界中試錯并獲取反饋;資源策略方面,持續(xù)投入大規(guī)模計算資源;落地環(huán)節(jié),把模型封裝成Agent,將模型能力打包成可審計的服務進程。
此次訪談由AI播客Latent Space主持,與Brockman探討了OpenAI的AGI整體技術路線與資源策略,同時其落地布局和對未來的思考也逐漸明晰。
總結Brockman的核心觀點如下:模型的現(xiàn)實交互能力不斷增強,這是下一代AGI的關鍵;AGI的主要瓶頸在于計算,計算量決定AI研究和發(fā)展的速度與深度;AGI的目標是讓大模型融入企業(yè)和個人工作流,實現(xiàn)手段是Agent;將模型應用于現(xiàn)實世界極具價值,各領域有很多待挖掘的機會。
模型推理范式的轉變
談及OpenAI剛發(fā)布的GPT - 5,Brockman認為這是AI領域的重大范式轉變。作為OpenAI首個混合模型,它旨在縮小GPT系列與AGI的差距。
訓練GPT - 4后,OpenAI思考:為什么它不是AGI?GPT - 4雖能進行連貫對話,但可靠性不足,會犯錯甚至偏離方向。因此,需要在現(xiàn)實世界測試想法,通過強化學習獲取反饋以提高可靠性。
OpenAI早期的Dota項目就采用了純強化學習,能從隨機初始化狀態(tài)學習復雜行為。
從GPT - 4完成起,OpenAI轉向新推理范式,先讓模型通過監(jiān)督數(shù)據(jù)學會對話,再借助強化學習在環(huán)境中反復試錯。傳統(tǒng)模型訓練是一次性訓練后大量推理,而GPT - 5借助強化學習,在推理中生成數(shù)據(jù)并重復訓練,將現(xiàn)實觀測反饋到模型。
這種新范式改變了所需數(shù)據(jù)規(guī)模,強化學習只需從10到100個任務中學習復雜行為,而傳統(tǒng)預訓練可能需數(shù)十萬個示例。這也表明模型的現(xiàn)實交互能力在增強,是下一代AGI的關鍵組成部分。
計算能力決定AGI開發(fā)上限
被問及AGI開發(fā)的主要瓶頸時,Brockman明確表示是計算。他認為,更多計算能力能讓OpenAI找到迭代和提升模型性能的方法,計算量決定AI研究和發(fā)展的速度與深度。
如Dota項目中,大家認為PPO算法無法擴展,但通過增加內核數(shù)量實現(xiàn)了性能提升,說明擴大計算資源可解決算法壁壘。
GPT - 5的強化學習范式雖樣本效率高,但重復學會一項任務需模型進行數(shù)萬次嘗試,需要大量計算支撐。
圖靈提出的“超臨界學習”概念,要求機器深入思考并更新知識體系,這也需要更多計算資源。OpenAI的目標是探索創(chuàng)造性消耗計算的方式,實現(xiàn)高級學習能力。
Brockman將計算比作基本燃料,能將能量轉化為模型權重中的勢能,推動模型有效操作。模型訓練完成后可反復利用,分攤計算成本。
他預測最終的AGI將是模型管理器,結合小型本地模型和大型云推理器實現(xiàn)自適應計算。GPT - 5的多模型混合和路由機制是初步嘗試,結合推理和非推理模型,根據(jù)場景選擇合適模型。
推理模型適用于深度智能且有思考時間的場景,非推理模型用于快速輸出。這種復合模型利用計算靈活性,組合不同能力和成本的模型,是AGI可能的形態(tài)。在AI驅動的未來經(jīng)濟中,計算資源需求高,獲取和分配計算資源很重要。
讓大模型進入生產(chǎn)
Brockman強調,模型要成為現(xiàn)實生產(chǎn)線的一部分。AGI的目標是讓大模型融入企業(yè)和個人工作流,而非停留在論文和演示中。
具體落地方式是將模型封裝成Agent,打包成可審計的服務進程。Brockman認為這種交互像與資深同事協(xié)作,關鍵是可控性,可隨時檢查和回滾。
為確保高權限Agent可控,OpenAI設計了雙層“縱深防御”:模型內部,對system、developer、user三種指令排序,丟棄不可信指令;模型外部,將高危操作拆分成最小粒度,通過多級沙箱確認。
他用數(shù)據(jù)庫安全類比,就像防SQL注入,先堵底層漏洞,再疊加防護,系統(tǒng)更穩(wěn)固。
除安全防護,與人類價值對齊也很重要。工程團隊先去除不受歡迎的“人格”,再將剩余“人格”放入公開競技場評分,形成模型與社會偏好的協(xié)同進化,保證模型能力升級不脫離人類共識,為在線學習打基礎。
為增強生態(tài)黏性,OpenAI將輕量級開源作為第二驅動力。Brockman認為開發(fā)者沉淀工具鏈,就默認采納了OpenAI的技術棧。
“各個領域還有大量尚未采摘的果實”
展望未來,Brockman認為值得投入的是將現(xiàn)有智能融入具體行業(yè)流程,而非打造更炫的“模型包裝器”。他提醒各行業(yè)鏈規(guī)模大,將模型應用于現(xiàn)實世界有很大價值,各領域有很多機會。
他建議開發(fā)者和創(chuàng)業(yè)者深入行業(yè)一線,了解細節(jié),用AI填補缺口,而非只做接口封裝。
被問到給2045年的自己留便簽,他的愿景是“多星際生活”和“真正的豐裕社會”。他認為按當前技術發(fā)展速度,二十年后很多科幻情節(jié)都可能實現(xiàn),唯一限制是物質搬運的物理極限。
同時,他提醒計算資源會稀缺,即便物質需求被自動化滿足,人們仍會追求更多算力。
如果穿越回18歲,他想告訴自己值得攻克的問題會增多。在AI滲透各行業(yè)的背景下,機遇隨技術發(fā)展而增加,真正的挑戰(zhàn)是保持好奇心,敢于進入新領域。
參考鏈接:[1]https://www.youtube.com/watch?v=35ZWesLrv5A
本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com