GPT-4升級被曝引入Q*,推理/數學更強廢話更少,試煉場重奪王位。
啥?
在Q*輸出方面,新版GPT-4進行了微調?
在試煉場重返榜一GPT-4的新版本 Turbo,再一次成功踩到大家嗨點。
這次性能的提高體現在數學、推理、代碼上,輸出內容的廢話更少。
最令人興奮的是,它最令人興奮的是數學/推理能力,現在可以在某些問題上超越其它大模型。
例如“求y=x^4-5x^2-x 4和y=x^y坐標之和,2-3x交點。"只有最新版本的GPT-4 Turbo可以測量。
這條推特公開承認自己參與了Q*的Lukaszz。 分享Kaiser。
Noam 新版本的GPT-44,Brown也發(fā)推。 Turbo的推理能力有了很大的提高——要知道,OpenAI科學家一直被外界認為是在研究Q*。
多方面的信息匯總之后,網友們一拍腦袋回過神來,這里面會不會引進Q*???
數學方面的提高意味著它可能包括一個數學模型,也可能是Q*。
(以及OpenAI的人轉發(fā)了他的數學題測試推特)
好家伙,OpenAI是不是在悄悄做大事?
新GPT-4的“新馬腳”?
根據OpenAI的官方消息,GPT-44的最新版本 現在ChatGPT用戶可以直接體驗Turbo的全方位提升。
網民們立即沖到實測,有人給出評價結果,尤其是數學/推理能力得到了很大的提升。
在實際問題測試中,在多個數學推理題上,GPT-4 Turbo也沒有翻車,但是像Command一樣-R plus、Clauede-3 Opus等都有錯誤。
舉例來說,乘坐電梯的推理問題。陷阱就是這部精彩的電梯無論坐多層,最后都會停在一樓。GPT-4 Turbo理解了這個邏輯,最后給出了正確的答案。
另外,對二叉樹問題進行修改,GPT-4 Turbo不但回答正確,而且過程清晰完整。
與此同時,在“海底撈針”能力方面,最新GPT-4 Turbo已經具備了GPT-4出版能力。4.3倍。
競技場的結果表明,在代碼能力方面,GPT-4 Turbo也更加強大。
在文字輸出方面變得更加簡潔。
生成代碼也少了許多廢話(下圖右側是新版本)。
還有人補充說,生成速度也比較快。
神秘Q*:OpenAI的最大秘密?
現在Q*已成為OpenAI的流量密碼,只要出現這個關鍵字,網友們就會興奮不已。
說到底,當初奧特曼宮斗大戲就和它有關,還有人發(fā)出警告,Q*這意味著AGI即將出現。
然而,官方從未公開承認該項目的存在,奧特曼拒絕回答,Transformer作者公開承認,OpenAI公關也跳起來捂住了嘴。
根據當前多方披露的信息,Q*專注于邏輯和數學推理能力,數學能力突出。
Lukaszzzzzsformer作者之一 Kaiser承認自己參加了這個項目。
德撲AI鼻祖,前FAIR(Meta)Noam,研究科學家 同時,Brown也被認為是Q*項目的重要成員(推斷來自LeCun)。
“他加入OpenAI的動作也被外界視為分析Q*的一條線索,”有理由懷疑Q是將LLM和AlphaGo結合起來,并且通過強化學習來練習。”。
Noam Brown開發(fā)了第一個在撲克牌上超越人類的AI,然后加入Meta,讓AI學會玩Diplomacy(外交游戲)。
現在,關于Q*的準確信息仍然很少。
也許奧特曼還在等待一個合適的時機來回應外界。
One More Thing
btw,網民意外地抓到了Brockman總裁轉發(fā)的一個視頻演示中的提示:
用pytube庫從YouTube下載視頻,創(chuàng)建python腳本。
看起來每個人拿GPT-4做的事情也差不多嗎?(doge)。
參考鏈接:
[1]https://twitter.com/lukaszkaiser
[2]https://twitter.com/skirano/status/1778122305471705489
[3]https://twitter.com/7oponaut//status/1777971159478194256
[4]https://twitter.com/ai_for_success/status/1778073765748064678
[5]https://www.understandingai.org/p/how-to-think-about-the-openai-q-rumors
本文來自微信微信官方賬號“量子位”(ID:QbitAI),作者:明敏,36氪經授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com