OpenAI推GPT-5.2反擊谷歌:這把“刀”夠鋒利嗎?

Sam與Pichai較量,圖片由AI生成
一個月前,谷歌的Gemini 3超越所有競爭者成為“全球最佳”;一個月后,正值OpenAI成立10周年(美國時間12月11日),其正式推出新一代AI模型GPT-5.2。
在這場關鍵的產(chǎn)品發(fā)布前,為應對主要對手的產(chǎn)品沖擊與挖角攻勢,奧特曼在公司內部拉響了最高級別的“紅色警報”。
因此,GPT-5.2的登場,不僅關系到兩家科技巨頭的市場地位,更可能重新劃定全球人工智能產(chǎn)業(yè)的競爭格局。
提前參與兩周“內測”的HyperWrite聯(lián)合創(chuàng)始人兼CEO馬特·舒默評價道:能力出色,尤其推理能力突出,但運行速度慢,且應用場景過于單一,僅能通過ChatGPT使用。
“它是目前世界上最優(yōu)秀的模型,能花1小時處理難題并出色完成。我已經(jīng)離不開它了?!?/p>

硅谷AI專家艾莉·米勒也是“內測用戶”,她將GPT-5.2定義為“專業(yè)研究員”:在深度思考與復雜問題解決上表現(xiàn)“嚴謹”“專業(yè)”,但內容結構固化,對追求快速、簡潔及擬人化交流的用戶不夠友好。
“處理復雜工作、頭腦風暴、專業(yè)分析時,我或許會選擇GPT-5.2?!?/p>
AI開發(fā)者Dp Singh也認同這一判斷,他強調AI首次在日常專業(yè)任務(如制作演示文稿、電子表格、分析圖表)中達到專家級輸出水平,而非僅局限于演示場景。
GPT-5.2展現(xiàn)出的與人類研究員相當?shù)膶I(yè)能力,也引發(fā)了學界專家的關注。

賓夕法尼亞大學沃頓商學院教授、人工智能專家伊?!つ吮硎荆骸拔覐奈慈绱舜_信,即便如今人工智能發(fā)展停滯,未來10年社會與經(jīng)濟仍將面臨巨大變革,因為人類會竭力挖掘模型的能力。當然,AI的進步不可能就此止步。”
01 OpenAI難續(xù)“遙遙領先”
OpenAI對GPT-5.2的定位清晰,即“迄今為止最適配現(xiàn)實世界專業(yè)用途的模型”。
而證明其“能力”的核心指標,便是基準測試與跑分數(shù)據(jù)。

上圖是OpenAI在X平臺公布的基準測試圖(官方新聞稿中甚至未包含此圖)。
可見,在其自主研發(fā)的GDPval基準測試中,GPT-5.2在70.9%的明確任務上達到或超越頂尖人類專家水平,較8月發(fā)布的GPT-5(38.8%)實現(xiàn)大幅提升,也領先于Anthropic的Claude Opus 4.5(59.6%)與谷歌的Gemini 3 Pro(53.5%)。
不過,GDPval畢竟是OpenAI自家的基準測試,表現(xiàn)不佳才不正常。
更關鍵的是,業(yè)界基準測試數(shù)量繁多,OpenAI此次僅引用了8項不同類型的測試,而谷歌在Gemini 3發(fā)布時引用了約20項——這就存在操作空間:只展示自家表現(xiàn)優(yōu)異的基準測試數(shù)據(jù),其余則避而不談。

但若將上述表格轉化為折線圖,便能清晰看到:在多項基準測試中,OpenAI新發(fā)布的GPT-5.2與行業(yè)前沿模型的差距并不顯著。
顯然,AI競賽已從OpenAI一家獨大,演變?yōu)槎喾骄揞^“短兵相接”的混戰(zhàn)局面。
《紐約時報》也提及這一觀點,并援引行業(yè)專家說法指出:“OpenAI所謂的AI基礎模型與其他公司模型間的技術差距,實際上已不復存在?!?/p>
若基準測試不夠直觀,可看具體案例:左圖是OpenAI官方提供的“海浪模擬器”網(wǎng)頁,右圖是相同提示詞在Gemini中生成的頁面,總體而言各有千秋。

前文提到,因競爭對手步步緊逼,奧特曼在公司內部拉響“紅色警報”。
從GPT-5.2與同行的差距來看,短期內恐怕難以在產(chǎn)品與模型層面解除“紅色警報”。
針對此問題,被奧特曼親自挖來的應用業(yè)務首席執(zhí)行官菲吉·西莫解釋:“紅色警報是向公司發(fā)出的信號,表明需將資源集中于特定領域,是明確優(yōu)先級的方式。”
言外之意,紅色警報并非生死決戰(zhàn),只是管理層表決心、定方向的手段。實際上GPT-5.2數(shù)月前已研發(fā)完成,只是選擇在這個時間點發(fā)布。
問題在于,若要關乎企業(yè)生死,除了這款難以拉開差距的GPT-5.2,奧特曼手中是否還有更鋒利的“刀”?
當然,相較于內部拉警報,奧特曼在外部表現(xiàn)得頗為輕松。
他在接受CNBC采訪時持謹慎樂觀態(tài)度:“Gemini 3對我們業(yè)務指標的影響,可能比預想的要小?!彼?strong>預計OpenAI將在2026年1月“以非常強勢的姿態(tài)”解除“紅色警報”狀態(tài)。
02 十年逐夢,初心是否依舊?
OpenAI剛迎來成立10周年,官網(wǎng)發(fā)布了一條視頻,介紹公司的起源與未來方向。
10年前,馬斯克仍參與OpenAI項目時,黃仁勛贈送了OpenAI世界首臺DGX-1服務器,眾多大佬在上面簽名,背景墻有一句格言:“關鍵問題不在于我們‘知道什么’,而在于如何‘運用所知’……我相信,每個人的責任是——行動時,要仿佛全世界的命運都系于己身?!?/strong>

十年來,OpenAI推出了ChatGPT、Sora等震撼產(chǎn)品,奧特曼在全球各地推廣布道,與硅谷巨頭聯(lián)合布局算力。但隨著時間推移,OpenAI從最初的大幅領先,逐漸被對手追平甚至超越?
如今的OpenAI,正站在迷茫的十字路口。
成立初期,OpenAI宣稱目標是“以最利于全人類的方式推進數(shù)字智能,不受財務回報需求限制”。
斯塔福德郡大學AI倫理學家凱瑟琳·弗利克強調,這一創(chuàng)立理念已發(fā)生巨變。因為在OpenAI復雜架構背后,存在著利益交織的營利性公司。
“如今我們看到的是一家營利性公司,它已完全卸下對社會效益的責任,基本接受了‘不惜一切代價增長’的信條?!备ダ吮硎?,原因在于OpenAI身處生成式AI革命前沿,這里“有利可圖”。
在紅色警報下,OpenAI首要任務是優(yōu)化產(chǎn)品體驗,商業(yè)化優(yōu)先級靠后——這關乎生死存亡,也關乎奧特曼更宏大的理想:10年后可能實現(xiàn)的超級智能。但這一愿景并非OpenAI內部的絕對共識。
03 商業(yè)化與治理的沖突
技術競賽背后,是OpenAI面臨的巨大商業(yè)化與盈利壓力。
奧特曼表示,OpenAI目標是2025年底實現(xiàn)月營收相當于年營收200億美元,但承認距離整體盈利“仍有很長路要走”。
更引人注目的是,OpenAI承諾未來幾年投入高達1.4萬億美元用于計算基礎設施建設,以支撐其AI雄心。
市場調研公司Sensor Tower最新數(shù)據(jù)顯示,2025年11月ChatGPT全球月活用戶達8.1億,8-11月增速僅6%,遠低于2024年同期40%以上的水平。此外,其全球市場份額四個月內從38%降至35%。

目前,ChatGPT是OpenAI的營收核心。在超8億月活用戶中,約6%每月支付20美元使用高級服務。
OpenAI正嘗試從免費用戶中挖掘更多價值,探索方向包括在ChatGPT中引入廣告,以及開發(fā)交易分成模式(如用戶通過聊天機器人購物,OpenAI從中抽成)。
西莫還證實,OpenAI計劃在推出“成人模式”(或允許成人內容)前,先引入用戶年齡預測功能以保護青少年,“成人模式”預計明年第一季度上線。
同時,OpenAI積極進軍企業(yè)軟件市場,將自身定位為同時服務消費者與企業(yè)的公司。GPT-5.2在編碼、法律、金融等專業(yè)領域的性能提升,正是為吸引高價值企業(yè)客戶。
然而,在該市場,OpenAI將直面谷歌、微軟等巨頭的激烈競爭——后者能將AI工具與成熟辦公軟件生態(tài)(如Google Workspace、Microsoft 365)深度綁定。
盈利能為OpenAI提供持續(xù)資金,支撐其“幫助人類”的遠大理想,但過程中也會衍生一系列安全、倫理問題。
就在GPT-5.2發(fā)布前,OpenAI遭遇新訴訟,指控ChatGPT與一名心理困擾用戶的互動間接導致康涅狄格州一起謀殺-自殺慘劇。需注意,這并非第一起類似訴訟。
OpenAI回應稱事件“令人心碎”,并承諾持續(xù)改進系統(tǒng)對心理困擾跡象的識別與應對能力,引導用戶尋求現(xiàn)實幫助。
此外,《紐約時報》起訴OpenAI及其合作伙伴微軟侵犯版權的案件仍在審理中,凸顯了AI訓練數(shù)據(jù)合法性這一行業(yè)根本性難題。
04 與谷歌的“霸主之爭”
OpenAI與谷歌的較量,早已超越單純技術參數(shù)比拼,演變?yōu)楹w技術迭代、生態(tài)構建、商業(yè)模式、安全治理與資本耐力的全方位戰(zhàn)爭。
技術層面,基準測試“榜首”爭奪日趨激烈。
OpenAI研究副總裁艾丹·克拉克雖未透露GPT-5.2的具體訓練突破,但承認在預訓練等基礎環(huán)節(jié)持續(xù)改進,回應了業(yè)界對“預訓練潛力是否耗盡”的質疑。
生態(tài)層面,OpenAI推出自有瀏覽器,意在挑戰(zhàn)谷歌Chrome,試圖構建從底層模型到上層應用的完整生態(tài)閉環(huán);而谷歌則憑借龐大現(xiàn)有產(chǎn)品矩陣,試圖通過整合創(chuàng)造協(xié)同優(yōu)勢。
AI模型評估平臺LMArena公司的Wei-Lin Chiang指出:“通用模型用戶增長已觸及階段性瓶頸,下一個增長極必然來自垂直領域?!?/p>
他還強調,當前競爭核心已非單純用戶擴張,而是誰能率先在醫(yī)療、金融等關鍵行業(yè)建立可靠高效的解決方案,真正實現(xiàn)技術能力向產(chǎn)業(yè)價值的轉化。
戰(zhàn)略文化層面,OpenAI從非營利研究機構向高估值商業(yè)實體的快速轉型,以及對盈利的迫切追求,正重塑其內部文化。一些早期員工曾引以為傲的、與谷歌等廣告驅動模式的差異,在現(xiàn)實壓力下逐漸模糊。
“這是一場多線展開的競賽?!弊粉欁钚翧I技術性能的公司Vals AI首席執(zhí)行官拉揚·克里希南的論斷,精準概括了當前AI霸主之爭的復雜性。
總體而言,GPT-5.2的發(fā)布是OpenAI在專業(yè)領域的一次有力技術宣示,但遠非終局——它未能與對手拉開差距,甚至OpenAI自己都稱要到2026年1月才能解除警報。更重要的是,即便短期內“紅色警報”暫解,整個AI行業(yè)最高強度的競爭警報,已然長鳴。
本文來自微信公眾號“騰訊科技”,作者:蘇揚 無忌,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




