亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

GPT-5:強(qiáng)大卻無(wú)趣的新模型

08-10 06:12

千呼萬(wàn)喚,OpenAI 終于推出了全世界網(wǎng)友期待已久的 GPT-5。

不到一天時(shí)間,OpenAI 的發(fā)布推文就獲得 300 萬(wàn)閱讀、3 萬(wàn)點(diǎn)贊,世超的朋友圈和群聊也全被 GPT-5 刷屏。

盡管大家嘴上說(shuō)著 OpenAI 越來(lái)越不行,不會(huì)再用,但每次他們發(fā)布新模型,AI 圈都會(huì)受到震動(dòng),不管關(guān)不關(guān)注 AI 的人都會(huì)參與討論??梢?jiàn),大家還是忘不了 ChatGPT。

那么,GPT-5 到底怎么樣呢?奧特曼稱(chēng)這是他們做過(guò)的最智能的模型,在任何領(lǐng)域都達(dá)到了博士級(jí)水平。

然而,從網(wǎng)友反應(yīng)來(lái)看,不少人對(duì)這個(gè)新版本 GPT 評(píng)價(jià)不佳,抱怨它根本不像 GPT-5,甚至不如 grok。

Polymarket 上發(fā)起了“哪家公司在八月末擁有最頂級(jí)的 AI 模型”的競(jìng)猜,發(fā)布會(huì)剛結(jié)束,谷歌和 OpenAI 的賠率就出現(xiàn)了兩極反轉(zhuǎn)。

更可笑的是,發(fā)布會(huì)時(shí) OpenAI 放的柱狀圖,比較大模型寫(xiě)代碼準(zhǔn)確度,52.8% 畫(huà)得比 69.1% 還高,這失誤實(shí)在低級(jí)。

網(wǎng)友反應(yīng)大,主要是奧特曼前期宣傳太夸張,還沒(méi)發(fā)布就大肆宣揚(yáng)。

不過(guò),GPT-5 的跑分很強(qiáng),在大模型競(jìng)技場(chǎng) LMArena 上獲得大滿(mǎn)貫,全方位排名第一。

但好不好用,還得用戶(hù)親自體驗(yàn)。世超體驗(yàn)后認(rèn)為,GPT-5 沒(méi)那么驚艷,不如叫 GPT4.6。

首先,GPT-5 的編程能力備受稱(chēng)贊。拿它和競(jìng)技場(chǎng)榜二的 Gemini 2.5 pro 對(duì)比。

讓它模擬高中的彈性碰撞,提示詞為“我是一名高中生,通過(guò)物理模擬讓我理解彈性碰撞”。

GPT-5 做得不錯(cuò),能標(biāo)注球的速度方向,碰撞時(shí)球的大小變化也很絲滑。而 Gemini 雖然也還行,但絲滑度不如 GPT-5,改變球大小就會(huì)卡住。

再用多米諾骨牌測(cè)試,很多 AI 都難以完成。GPT-5 做出的效果很有動(dòng)感,提示詞為“模擬多米諾骨牌的物理過(guò)程,左鍵放牌,右鍵倒牌”。

而 Gemini 對(duì)這個(gè)需求理解不佳,牌甚至?xí)斓教焐稀?/p>

不過(guò)也有搞笑的情況,讓 GPT-5 生成開(kāi)飛船的游戲,結(jié)果尾焰和動(dòng)力方向不一致,一出門(mén)就墜機(jī)。

除編程外,其他更新主要是對(duì)現(xiàn)有能力的優(yōu)化。OpenAI 此次更新朝著“節(jié)能高效”方向,不同于 GPT3.5 到 4 的飛躍式更新。

據(jù) OpenAI 官方博客介紹,GPT-5 思考和輸出更高效,保證準(zhǔn)確率的同時(shí),思考時(shí)間更短,輸出的 Token 數(shù)量減少 50% 到 80%。

它還大力解決了幻覺(jué)問(wèn)題,事實(shí)錯(cuò)誤率比 GPT-4o 低 45%,思考時(shí)的事實(shí)錯(cuò)誤率低約 80%。

這意味著 GPT-5 更誠(chéng)實(shí),清楚自己能力邊界,遇到不會(huì)的問(wèn)題會(huì)直說(shuō)。

對(duì)于編輯來(lái)說(shuō),模型寫(xiě)文章的能力很重要。但體驗(yàn)發(fā)現(xiàn),GPT-5 在文本創(chuàng)作上有些力不從心,像失去靈感的詩(shī)人。

它在邏輯、推理、數(shù)學(xué)、編程等領(lǐng)域表現(xiàn)出色,但文本創(chuàng)作方面卻有所欠缺。

讓 GPT-5 撰寫(xiě)一段夸自己的文字,結(jié)果寫(xiě)了首略微肉麻的詩(shī)。

再看 Gemini 夸自己的內(nèi)容,感覺(jué) AI 味道更淡。

雖然發(fā)布會(huì)上說(shuō) GPT-5 大幅減少了幻覺(jué),但文本變得過(guò)于保守,缺少獨(dú)特視角和奇妙比喻。

此外,發(fā)布 GPT-5 時(shí),OpenAI 強(qiáng)行刪除了之前的其他模型,現(xiàn)在 GPT 界面基本只能看到 GPT-5 選項(xiàng)。

這種操作有些離譜,國(guó)內(nèi)模型還能讓用戶(hù)選擇是否“深度思考”,而 OpenAI 卻收回了用戶(hù)的選擇權(quán)。不過(guò),ChatGPT 的 Pro 會(huì)員還能使用舊模型。

而且,官方存在偷偷降智的行為,奧特曼發(fā)布會(huì)上展示的做音樂(lè)例子,部分用戶(hù)無(wú)法復(fù)刻。

總體而言,這次 OpenAI 更新更注重“實(shí)用第一”策略。一方面可能是大模型基座性能升級(jí)遇到瓶頸,另一方面這種調(diào)整有意義,過(guò)去大模型追求性能升級(jí)忽視了幻覺(jué)、成本等問(wèn)題。

如今 OpenAI 周活躍用戶(hù)達(dá) 7 億,性能升級(jí)有限時(shí),打磨產(chǎn)品體驗(yàn)很有必要。

大家還是可以有所期待,下一個(gè)被寄予厚望的模型可能是 DeepSeek R2 和 Gemini 3.0。

撰文:不咕

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com