亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

GPT-5.2定價(jià)超DeepSeek 400倍引爭(zhēng)議,它真的配得上高價(jià)嗎?

1天前

GPT-5.2的定價(jià)達(dá)到DeepSeek的400倍,比谷歌Gemini 3 Pro也高出近10倍。


OpenAI新發(fā)布的GPT-5.2,究竟實(shí)力如何?


或許可以說,它是最貼合打工人需求的AI之一,因?yàn)樗赡芡苿?dòng)AI從基礎(chǔ)助手向?qū)I(yè)級(jí)工具轉(zhuǎn)變。


首先在專業(yè)能力上,GPT-5.2有七成概率能勝過屏幕前刷視頻的行業(yè)專家。


單看跑分,GPT-5.2在各維度都比Gemini 3 Pro略高一點(diǎn)。


不過優(yōu)勢(shì)僅在毫厘之間,不排除OpenAI針對(duì)Gemini優(yōu)化測(cè)試成績(jī)的可能。


但OpenAI此次最看重的是GDPval測(cè)試結(jié)果。


這是今年925期間推出的全新測(cè)試方法,用于評(píng)估AI能否真正協(xié)助打工人完成工作。


他們邀請(qǐng)了九個(gè)領(lǐng)域、四十四類行業(yè)的專家,結(jié)合實(shí)際工作場(chǎng)景出題。


以此檢驗(yàn)AI能否勝任專家的工作任務(wù)。


結(jié)果顯示,GPT-5.2在七成工作任務(wù)中能與人類持平甚至表現(xiàn)更優(yōu)。


我們也對(duì)新模型做了簡(jiǎn)單測(cè)試:讓GPT-5.2統(tǒng)計(jì)互聯(lián)網(wǎng)上AI公司發(fā)布的所有模型。


接著統(tǒng)計(jì)這些模型在各排行榜的分?jǐn)?shù),最后按月份整理成表格。


經(jīng)過14分鐘的處理,GPT-5.2成功完成了數(shù)據(jù)收集、結(jié)果統(tǒng)計(jì)和表格繪制的全流程任務(wù)。


這樣的完成度確實(shí)值得肯定。


此外,GPT-5.2還能完成復(fù)雜表格工作,制作的表格比舊版本更美觀。


各項(xiàng)任務(wù)測(cè)試指標(biāo)也提升了約9%。


代碼編寫能力方面,GPT-5.2也有不少進(jìn)步。


生成錯(cuò)誤內(nèi)容的概率比之前降低了38%。


這讓用戶使用起來(lái)更安心。


我們也做了簡(jiǎn)單測(cè)試,但或許是Gemini珠玉在前,GPT-5.2給人的感覺略顯平淡。


讓它編寫Aimlab(一款瞄準(zhǔn)練習(xí)小游戲)。


它確實(shí)能完成,寫出的程序不僅可運(yùn)行,還能調(diào)整靶子大小、游戲時(shí)長(zhǎng)等基礎(chǔ)參數(shù)。


這些功能都沒問題,但整體過于中規(guī)中矩。


在界面設(shè)計(jì)上,上個(gè)月發(fā)布的Gemini 3明顯更勝一籌。


同樣的需求下,Gemini已經(jīng)開始運(yùn)用潮流配色,而GPT還停留在基礎(chǔ)界面設(shè)計(jì)階段。


當(dāng)然,這也可能是因?yàn)闆]有明確要求GPT優(yōu)化界面的緣故。


除了工作能力提升,GPT-5.2還有一個(gè)有趣的變化。


它更能理解人類指令了。


測(cè)試發(fā)現(xiàn),讓GPT寫50個(gè)創(chuàng)意,它會(huì)認(rèn)真完成50個(gè),不像舊模型寫10個(gè)就敷衍了事。


此外,上下文處理能力也得到加強(qiáng),插針實(shí)驗(yàn)顯示,即使文本長(zhǎng)度達(dá)256K,識(shí)別準(zhǔn)確率仍接近100%。


這相當(dāng)于在幾十萬(wàn)字的名著中偷偷加入幾句批評(píng)內(nèi)容,它都能精準(zhǔn)找出。


這對(duì)寫代碼、做學(xué)術(shù)、整理文書的打工人和科研人員來(lái)說,是一大助力。


雖然紙面實(shí)力強(qiáng)勁,但GPT-5.2也有短板。


比如官方展示的圖像識(shí)別案例中,Gemini 3 Pro的識(shí)別精度遠(yuǎn)超GPT-5.2。


也有人吐槽,新模型發(fā)布后,舊版本可能會(huì)“降智”。


這已是常見現(xiàn)象。


最后,GPT-5.2的發(fā)布讓我們看到一個(gè)趨勢(shì)。


未來(lái)頂級(jí)AI模型的差異化會(huì)更明顯,各有側(cè)重。


比如Gemini可能在全模態(tài)領(lǐng)域領(lǐng)先;GPT在邏輯推理和生產(chǎn)力方面保持優(yōu)勢(shì);Claude在代碼和寫作能力上繼續(xù)領(lǐng)跑。


因?yàn)樵趯?shí)現(xiàn)AGI(通用人工智能)的路徑上,大廠們的思路已出現(xiàn)分歧:谷歌認(rèn)為多模態(tài)感知是未來(lái);OpenAI堅(jiān)信邏輯推理和生產(chǎn)力提升是關(guān)鍵;Anthropic則看重高維度語(yǔ)義理解與對(duì)齊。


AI領(lǐng)域的競(jìng)爭(zhēng)仍在持續(xù),下一個(gè)發(fā)布新模型的應(yīng)該是Anthropic。


對(duì)了,最后想問:奧特曼承諾的成人模式,何時(shí)上線?


撰文:江江 & 早起


編輯:江江 & 面線


美編:煥妍


圖片、資料來(lái)源:OpenAI 官網(wǎng)


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com