亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<code id="kaceu"><dd id="kaceu"></dd></code>

<source id="kaceu"><pre id="kaceu"></pre></source>

<fieldset id="kaceu"><tr id="kaceu"></tr></fieldset>

GPT-5：強(qiáng)大卻無趣的新模型

08-10 06:12

千呼萬喚，OpenAI 終于推出了全世界網(wǎng)友期待已久的 GPT-5。

不到一天時(shí)間，OpenAI 的發(fā)布推文就獲得 300 萬閱讀、3 萬點(diǎn)贊，世超的朋友圈和群聊也全被 GPT-5 刷屏。

盡管大家嘴上說著 OpenAI 越來越不行，不會(huì)再用，但每次他們發(fā)布新模型，AI 圈都會(huì)受到震動(dòng)，不管關(guān)不關(guān)注 AI 的人都會(huì)參與討論。可見，大家還是忘不了 ChatGPT。

那么，GPT-5 到底怎么樣呢？奧特曼稱這是他們做過的最智能的模型，在任何領(lǐng)域都達(dá)到了博士級(jí)水平。

然而，從網(wǎng)友反應(yīng)來看，不少人對(duì)這個(gè)新版本 GPT 評(píng)價(jià)不佳，抱怨它根本不像 GPT-5，甚至不如 grok。

Polymarket 上發(fā)起了“哪家公司在八月末擁有最頂級(jí)的 AI 模型”的競(jìng)猜，發(fā)布會(huì)剛結(jié)束，谷歌和 OpenAI 的賠率就出現(xiàn)了兩極反轉(zhuǎn)。

更可笑的是，發(fā)布會(huì)時(shí) OpenAI 放的柱狀圖，比較大模型寫代碼準(zhǔn)確度，52.8% 畫得比 69.1% 還高，這失誤實(shí)在低級(jí)。

網(wǎng)友反應(yīng)大，主要是奧特曼前期宣傳太夸張，還沒發(fā)布就大肆宣揚(yáng)。

不過，GPT-5 的跑分很強(qiáng)，在大模型競(jìng)技場(chǎng) LMArena 上獲得大滿貫，全方位排名第一。

但好不好用，還得用戶親自體驗(yàn)。世超體驗(yàn)后認(rèn)為，GPT-5 沒那么驚艷，不如叫 GPT4.6。

首先，GPT-5 的編程能力備受稱贊。拿它和競(jìng)技場(chǎng)榜二的 Gemini 2.5 pro 對(duì)比。

讓它模擬高中的彈性碰撞，提示詞為“我是一名高中生，通過物理模擬讓我理解彈性碰撞”。

GPT-5 做得不錯(cuò)，能標(biāo)注球的速度方向，碰撞時(shí)球的大小變化也很絲滑。而 Gemini 雖然也還行，但絲滑度不如 GPT-5，改變球大小就會(huì)卡住。

再用多米諾骨牌測(cè)試，很多 AI 都難以完成。GPT-5 做出的效果很有動(dòng)感，提示詞為“模擬多米諾骨牌的物理過程，左鍵放牌，右鍵倒牌”。

而 Gemini 對(duì)這個(gè)需求理解不佳，牌甚至?xí)斓教焐稀?/p>

不過也有搞笑的情況，讓 GPT-5 生成開飛船的游戲，結(jié)果尾焰和動(dòng)力方向不一致，一出門就墜機(jī)。

除編程外，其他更新主要是對(duì)現(xiàn)有能力的優(yōu)化。OpenAI 此次更新朝著“節(jié)能高效”方向，不同于 GPT3.5 到 4 的飛躍式更新。

據(jù) OpenAI 官方博客介紹，GPT-5 思考和輸出更高效，保證準(zhǔn)確率的同時(shí)，思考時(shí)間更短，輸出的 Token 數(shù)量減少 50% 到 80%。

它還大力解決了幻覺問題，事實(shí)錯(cuò)誤率比 GPT-4o 低 45%，思考時(shí)的事實(shí)錯(cuò)誤率低約 80%。

這意味著 GPT-5 更誠(chéng)實(shí)，清楚自己能力邊界，遇到不會(huì)的問題會(huì)直說。

對(duì)于編輯來說，模型寫文章的能力很重要。但體驗(yàn)發(fā)現(xiàn)，GPT-5 在文本創(chuàng)作上有些力不從心，像失去靈感的詩(shī)人。

它在邏輯、推理、數(shù)學(xué)、編程等領(lǐng)域表現(xiàn)出色，但文本創(chuàng)作方面卻有所欠缺。

讓 GPT-5 撰寫一段夸自己的文字，結(jié)果寫了首略微肉麻的詩(shī)。

再看 Gemini 夸自己的內(nèi)容，感覺 AI 味道更淡。

雖然發(fā)布會(huì)上說 GPT-5 大幅減少了幻覺，但文本變得過于保守，缺少獨(dú)特視角和奇妙比喻。

此外，發(fā)布 GPT-5 時(shí)，OpenAI 強(qiáng)行刪除了之前的其他模型，現(xiàn)在 GPT 界面基本只能看到 GPT-5 選項(xiàng)。

這種操作有些離譜，國(guó)內(nèi)模型還能讓用戶選擇是否“深度思考”，而 OpenAI 卻收回了用戶的選擇權(quán)。不過，ChatGPT 的 Pro 會(huì)員還能使用舊模型。

而且，官方存在偷偷降智的行為，奧特曼發(fā)布會(huì)上展示的做音樂例子，部分用戶無法復(fù)刻。

總體而言，這次 OpenAI 更新更注重“實(shí)用第一”策略。一方面可能是大模型基座性能升級(jí)遇到瓶頸，另一方面這種調(diào)整有意義，過去大模型追求性能升級(jí)忽視了幻覺、成本等問題。

如今 OpenAI 周活躍用戶達(dá) 7 億，性能升級(jí)有限時(shí)，打磨產(chǎn)品體驗(yàn)很有必要。

大家還是可以有所期待，下一個(gè)被寄予厚望的模型可能是 DeepSeek R2 和 Gemini 3.0。

撰文：不咕

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

亞馬遜財(cái)報(bào)公布，自研AI芯片成破局關(guān)鍵

全球最大規(guī)模二氧化碳儲(chǔ)能項(xiàng)目主體結(jié)構(gòu)封頂

震驚！湖人簽下歷史第一高薪球員，東契奇未來可期

Wi-Fi7需求旺盛，高通、Synaptics、康希通信各有何舉措？

清華力量賦能深圳動(dòng)能，“X-Day”西麗湖路演社清華校友項(xiàng)目專場(chǎng)圓滿舉辦

項(xiàng)目推薦

<code id="2gic2"><pre id="2gic2"></pre></code>

<td id="2gic2"><dd id="2gic2"></dd></td>