亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

OpenAI總裁揭秘GPT - 5推理范式變革,計算成AGI實現(xiàn)關鍵

08-19 07:15

OpenAI的AGI發(fā)展路徑,總裁Greg Brockman在最新訪談中清晰闡述。

技術上,從文本生成轉向強化學習的推理范式,在現(xiàn)實世界中試錯并獲取反饋;資源策略方面,持續(xù)投入大規(guī)模計算資源;落地環(huán)節(jié),把模型封裝成Agent,將模型能力打包成可審計的服務進程。

此次訪談由AI播客Latent Space主持,與Brockman探討了OpenAI的AGI整體技術路線與資源策略,同時其落地布局和對未來的思考也逐漸明晰。

總結Brockman的核心觀點如下:模型的現(xiàn)實交互能力不斷增強,這是下一代AGI的關鍵;AGI的主要瓶頸在于計算,計算量決定AI研究和發(fā)展的速度與深度;AGI的目標是讓大模型融入企業(yè)和個人工作流,實現(xiàn)手段是Agent;將模型應用于現(xiàn)實世界極具價值,各領域有很多待挖掘的機會。

模型推理范式的轉變

談及OpenAI剛發(fā)布的GPT - 5,Brockman認為這是AI領域的重大范式轉變。作為OpenAI首個混合模型,它旨在縮小GPT系列與AGI的差距。

訓練GPT - 4后,OpenAI思考:為什么它不是AGI?GPT - 4雖能進行連貫對話,但可靠性不足,會犯錯甚至偏離方向。因此,需要在現(xiàn)實世界測試想法,通過強化學習獲取反饋以提高可靠性。

OpenAI早期的Dota項目就采用了純強化學習,能從隨機初始化狀態(tài)學習復雜行為。

從GPT - 4完成起,OpenAI轉向新推理范式,先讓模型通過監(jiān)督數(shù)據(jù)學會對話,再借助強化學習在環(huán)境中反復試錯。傳統(tǒng)模型訓練是一次性訓練后大量推理,而GPT - 5借助強化學習,在推理中生成數(shù)據(jù)并重復訓練,將現(xiàn)實觀測反饋到模型。

這種新范式改變了所需數(shù)據(jù)規(guī)模,強化學習只需從10到100個任務中學習復雜行為,而傳統(tǒng)預訓練可能需數(shù)十萬個示例。這也表明模型的現(xiàn)實交互能力在增強,是下一代AGI的關鍵組成部分。

計算能力決定AGI開發(fā)上限

被問及AGI開發(fā)的主要瓶頸時,Brockman明確表示是計算。他認為,更多計算能力能讓OpenAI找到迭代和提升模型性能的方法,計算量決定AI研究和發(fā)展的速度與深度。

如Dota項目中,大家認為PPO算法無法擴展,但通過增加內核數(shù)量實現(xiàn)了性能提升,說明擴大計算資源可解決算法壁壘。

GPT - 5的強化學習范式雖樣本效率高,但重復學會一項任務需模型進行數(shù)萬次嘗試,需要大量計算支撐。

圖靈提出的“超臨界學習”概念,要求機器深入思考并更新知識體系,這也需要更多計算資源。OpenAI的目標是探索創(chuàng)造性消耗計算的方式,實現(xiàn)高級學習能力。

Brockman將計算比作基本燃料,能將能量轉化為模型權重中的勢能,推動模型有效操作。模型訓練完成后可反復利用,分攤計算成本。

他預測最終的AGI將是模型管理器,結合小型本地模型和大型云推理器實現(xiàn)自適應計算。GPT - 5的多模型混合和路由機制是初步嘗試,結合推理和非推理模型,根據(jù)場景選擇合適模型。

推理模型適用于深度智能且有思考時間的場景,非推理模型用于快速輸出。這種復合模型利用計算靈活性,組合不同能力和成本的模型,是AGI可能的形態(tài)。在AI驅動的未來經(jīng)濟中,計算資源需求高,獲取和分配計算資源很重要。

讓大模型進入生產(chǎn)

Brockman強調,模型要成為現(xiàn)實生產(chǎn)線的一部分。AGI的目標是讓大模型融入企業(yè)和個人工作流,而非停留在論文和演示中。

具體落地方式是將模型封裝成Agent,打包成可審計的服務進程。Brockman認為這種交互像與資深同事協(xié)作,關鍵是可控性,可隨時檢查和回滾。

為確保高權限Agent可控,OpenAI設計了雙層“縱深防御”:模型內部,對system、developer、user三種指令排序,丟棄不可信指令;模型外部,將高危操作拆分成最小粒度,通過多級沙箱確認。

他用數(shù)據(jù)庫安全類比,就像防SQL注入,先堵底層漏洞,再疊加防護,系統(tǒng)更穩(wěn)固。

除安全防護,與人類價值對齊也很重要。工程團隊先去除不受歡迎的“人格”,再將剩余“人格”放入公開競技場評分,形成模型與社會偏好的協(xié)同進化,保證模型能力升級不脫離人類共識,為在線學習打基礎。

為增強生態(tài)黏性,OpenAI將輕量級開源作為第二驅動力。Brockman認為開發(fā)者沉淀工具鏈,就默認采納了OpenAI的技術棧。

“各個領域還有大量尚未采摘的果實”

展望未來,Brockman認為值得投入的是將現(xiàn)有智能融入具體行業(yè)流程,而非打造更炫的“模型包裝器”。他提醒各行業(yè)鏈規(guī)模大,將模型應用于現(xiàn)實世界有很大價值,各領域有很多機會。

他建議開發(fā)者和創(chuàng)業(yè)者深入行業(yè)一線,了解細節(jié),用AI填補缺口,而非只做接口封裝。

被問到給2045年的自己留便簽,他的愿景是“多星際生活”和“真正的豐裕社會”。他認為按當前技術發(fā)展速度,二十年后很多科幻情節(jié)都可能實現(xiàn),唯一限制是物質搬運的物理極限。

同時,他提醒計算資源會稀缺,即便物質需求被自動化滿足,人們仍會追求更多算力。

如果穿越回18歲,他想告訴自己值得攻克的問題會增多。在AI滲透各行業(yè)的背景下,機遇隨技術發(fā)展而增加,真正的挑戰(zhàn)是保持好奇心,敢于進入新領域。

參考鏈接:[1]https://www.youtube.com/watch?v=35ZWesLrv5A

本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經(jīng)授權發(fā)布。

本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com