亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<span id="xbhzm"><small id="xbhzm"></small></span>

OpenAI總裁揭秘GPT - 5推理范式變革，計算成AGI實現(xiàn)關鍵

08-19 07:15

OpenAI的AGI發(fā)展路徑，總裁Greg Brockman在最新訪談中清晰闡述。

技術上，從文本生成轉向強化學習的推理范式，在現(xiàn)實世界中試錯并獲取反饋；資源策略方面，持續(xù)投入大規(guī)模計算資源；落地環(huán)節(jié)，把模型封裝成Agent，將模型能力打包成可審計的服務進程。

此次訪談由AI播客Latent Space主持，與Brockman探討了OpenAI的AGI整體技術路線與資源策略，同時其落地布局和對未來的思考也逐漸明晰。

總結Brockman的核心觀點如下：模型的現(xiàn)實交互能力不斷增強，這是下一代AGI的關鍵；AGI的主要瓶頸在于計算，計算量決定AI研究和發(fā)展的速度與深度；AGI的目標是讓大模型融入企業(yè)和個人工作流，實現(xiàn)手段是Agent；將模型應用于現(xiàn)實世界極具價值，各領域有很多待挖掘的機會。

模型推理范式的轉變

談及OpenAI剛發(fā)布的GPT - 5，Brockman認為這是AI領域的重大范式轉變。作為OpenAI首個混合模型，它旨在縮小GPT系列與AGI的差距。

訓練GPT - 4后，OpenAI思考：為什么它不是AGI？GPT - 4雖能進行連貫對話，但可靠性不足，會犯錯甚至偏離方向。因此，需要在現(xiàn)實世界測試想法，通過強化學習獲取反饋以提高可靠性。

OpenAI早期的Dota項目就采用了純強化學習，能從隨機初始化狀態(tài)學習復雜行為。

從GPT - 4完成起，OpenAI轉向新推理范式，先讓模型通過監(jiān)督數(shù)據(jù)學會對話，再借助強化學習在環(huán)境中反復試錯。傳統(tǒng)模型訓練是一次性訓練后大量推理，而GPT - 5借助強化學習，在推理中生成數(shù)據(jù)并重復訓練，將現(xiàn)實觀測反饋到模型。

這種新范式改變了所需數(shù)據(jù)規(guī)模，強化學習只需從10到100個任務中學習復雜行為，而傳統(tǒng)預訓練可能需數(shù)十萬個示例。這也表明模型的現(xiàn)實交互能力在增強，是下一代AGI的關鍵組成部分。

計算能力決定AGI開發(fā)上限

被問及AGI開發(fā)的主要瓶頸時，Brockman明確表示是計算。他認為，更多計算能力能讓OpenAI找到迭代和提升模型性能的方法，計算量決定AI研究和發(fā)展的速度與深度。

如Dota項目中，大家認為PPO算法無法擴展，但通過增加內核數(shù)量實現(xiàn)了性能提升，說明擴大計算資源可解決算法壁壘。

GPT - 5的強化學習范式雖樣本效率高，但重復學會一項任務需模型進行數(shù)萬次嘗試，需要大量計算支撐。

圖靈提出的“超臨界學習”概念，要求機器深入思考并更新知識體系，這也需要更多計算資源。OpenAI的目標是探索創(chuàng)造性消耗計算的方式，實現(xiàn)高級學習能力。

Brockman將計算比作基本燃料，能將能量轉化為模型權重中的勢能，推動模型有效操作。模型訓練完成后可反復利用，分攤計算成本。

他預測最終的AGI將是模型管理器，結合小型本地模型和大型云推理器實現(xiàn)自適應計算。GPT - 5的多模型混合和路由機制是初步嘗試，結合推理和非推理模型，根據(jù)場景選擇合適模型。

推理模型適用于深度智能且有思考時間的場景，非推理模型用于快速輸出。這種復合模型利用計算靈活性，組合不同能力和成本的模型，是AGI可能的形態(tài)。在AI驅動的未來經(jīng)濟中，計算資源需求高，獲取和分配計算資源很重要。

讓大模型進入生產(chǎn)

Brockman強調，模型要成為現(xiàn)實生產(chǎn)線的一部分。AGI的目標是讓大模型融入企業(yè)和個人工作流，而非停留在論文和演示中。

具體落地方式是將模型封裝成Agent，打包成可審計的服務進程。Brockman認為這種交互像與資深同事協(xié)作，關鍵是可控性，可隨時檢查和回滾。

為確保高權限Agent可控，OpenAI設計了雙層“縱深防御”：模型內部，對system、developer、user三種指令排序，丟棄不可信指令；模型外部，將高危操作拆分成最小粒度，通過多級沙箱確認。

他用數(shù)據(jù)庫安全類比，就像防SQL注入，先堵底層漏洞，再疊加防護，系統(tǒng)更穩(wěn)固。

除安全防護，與人類價值對齊也很重要。工程團隊先去除不受歡迎的“人格”，再將剩余“人格”放入公開競技場評分，形成模型與社會偏好的協(xié)同進化，保證模型能力升級不脫離人類共識，為在線學習打基礎。

為增強生態(tài)黏性，OpenAI將輕量級開源作為第二驅動力。Brockman認為開發(fā)者沉淀工具鏈，就默認采納了OpenAI的技術棧。

“各個領域還有大量尚未采摘的果實”

展望未來，Brockman認為值得投入的是將現(xiàn)有智能融入具體行業(yè)流程，而非打造更炫的“模型包裝器”。他提醒各行業(yè)鏈規(guī)模大，將模型應用于現(xiàn)實世界有很大價值，各領域有很多機會。

他建議開發(fā)者和創(chuàng)業(yè)者深入行業(yè)一線，了解細節(jié)，用AI填補缺口，而非只做接口封裝。

被問到給2045年的自己留便簽，他的愿景是“多星際生活”和“真正的豐裕社會”。他認為按當前技術發(fā)展速度，二十年后很多科幻情節(jié)都可能實現(xiàn)，唯一限制是物質搬運的物理極限。

同時，他提醒計算資源會稀缺，即便物質需求被自動化滿足，人們仍會追求更多算力。

如果穿越回18歲，他想告訴自己值得攻克的問題會增多。在AI滲透各行業(yè)的背景下，機遇隨技術發(fā)展而增加，真正的挑戰(zhàn)是保持好奇心，敢于進入新領域。

參考鏈接：[1]https://www.youtube.com/watch?v=35ZWesLrv5A

本文來自微信公眾號“量子位”，作者：關注前沿科技，36氪經(jīng)授權發(fā)布。

本文僅代表作者觀點，版權歸原創(chuàng)者所有，如需轉載請在文中注明來源及作者名字。

免責聲明：本文系轉載編輯文章，僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

電車車險持續(xù)漲價：車主喊貴、險司喊虧，原因何在？

新能源5年補貼終審：北汽斬獲豐厚，比亞迪分得有限

盒馬十年：中國新零售的進化與反思之路

AI Agent新突破：GenFlow2.0引領智能協(xié)作新時代

Z世代宣言：伯克利學霸預言課堂，用AI設計人生與教育變革

<label id="8yj79"></label>