讓ChatGPT做姜萍的數(shù)學(xué)競賽題:它是愚蠢的,我也是愚蠢的。
The following article is from 卡茲克的數(shù)字生命 Author 卡茲克的數(shù)字生命
本來以為再差也不會那么離譜,好家伙你直接給我這個?
———— / BEGIN / ————
最近有個叫姜萍的小姑娘火了。
不只是因為她進入了 2024 而且,由于她是阿里巴巴全球數(shù)學(xué)競賽決賽的入圍名單, 17 歲、93 分、全球第 12 名字。而且是前30名中唯一的女孩。
更加爆棚的是,是她的學(xué)校。
江蘇省漣水中等專業(yè)學(xué)校。
嗯,中專。
北大、劍橋、清華、清華、MIT、中國科學(xué)院等。
這所江蘇省漣水中等專業(yè)學(xué)校,讓人十分出戲。
并且她主修服裝設(shè)計。
這個時候,把我的人看得都麻木了。
今年是阿里全球數(shù)學(xué)競賽的第六屆,而姜萍,也是有史以來第一個進入決賽的中專學(xué)生。
網(wǎng)上鋪天蓋地,關(guān)于她的討論太多了。無論如何,在這里,先把膝蓋獻給小女孩。我希望她能越走越遠,爬上她理想的高峰。
同時也讓我對另一點很好奇,2024 阿里巴巴全球數(shù)學(xué)競賽,這是一場什么比賽?
接著我去查資料和題目。
才發(fā)現(xiàn)原來是馬爸爸。 2018 2008年開始的比賽,隨后阿里巴巴公益、達摩院將其打造成當(dāng)今世界上規(guī)模最大的在線數(shù)學(xué)競賽。
而且最有趣的是,今年的比賽,有一點非常創(chuàng)新,那就是支持, AI 團隊參賽。
然后有 563 支 AI 隊伍沖進去,但沒有一個入選。得分最高 34 分,跟人類第一 113 分差相當(dāng)遠,與姜萍相比。 93 分?jǐn)?shù)也有很大的距離。
看了一下 AI 小組名單,第一名是高中生,第二名是老熟人,特工宇宙。
但他們都采用了許多工程技術(shù)。
突然間,我對這次數(shù)學(xué)競賽的題目感興趣,只想看看題目有多難。
接著我把考題翻了出來。
第 1 題:
看到這個問題,我覺得自己剛才說話有點大聲。
腦子里就在幻視這個小同學(xué)獨闖迷蹤陣,有一個 6 一個樁,小同學(xué)迷失在迷蹤中,緩過神來發(fā)現(xiàn)怎么只有四個樁。不是問樁在哪里,而是問有多少小同學(xué)… ...
但沒關(guān)系,我有 AI,所以我什么也沒加 Prompt 和 Agent,就這樣直接把這張圖丟了 ChatGPT。
總而言之,看了一頓很厲害的導(dǎo)出之后,GG 了。
答案是 6,你整個 復(fù)制者12,對嗎?
老師告訴我們,考試的時候不要在第一題上浪費太多時間。然后冷靜地看第二個問題。
第 2 題:
我:好?。∵@個問題我會,戰(zhàn)機游戲!AABB 上上下下!完成了。
對于 ChatGPT,他讓我想起了那首歌,《全選》 C》。
全部錯誤,答案是 B 和 A。
第三個問題是人類和人工智能的選擇。
第 3 題:
我:這怎么會有立體效果?沒有,那個 Z,怎樣鏤空?數(shù)學(xué)試卷開始使用 Windows 藝術(shù)詞匯?整篇文章我看見一個濃密的,讓我的大腦變得濃密。
ChatGPT:
有相當(dāng)多的小字,一堆我看不懂的東西向上打招呼。雖然看不懂公式,但至少能看懂不同的音調(diào)。你的公式都和答案不一樣。
第 4 題:
我:是誰?!是誰釋放了我的大腦空咒… ...
對于 ChatGPT... 算了,它認慫了。
第 5 題:
我:多年的經(jīng)驗告訴我,字少事大。
果不其然,定睛一看,那個 R,又特別是藝術(shù)字。
沒有,答案里顯然有很多這樣的小音符。
那么問題來了,ChatGPT,你們的小音符呢?沒有小音符,你敢說你是對的嗎?
第 6 題:
我:好家伙終于認識了!五福我熟悉啊,每年的??ㄎ叶紩占饋怼?/p>
勉強蒙對 1/2,但整個過程是錯誤的。
的確純粹靠蒙。
繼續(xù)錯誤的第二個問題。
最后,來到最后一個問題。
第 7 題:
我:啊?
你們給我閱讀理解嗎?
你們不是音樂,不是小紅和小綠嗎?難道不是一起去樹下,搞笑樹下的搞笑果實,搞笑樹下的你和我?
對于 ChatGPT...
洗洗睡吧。
最后 ChatGPT 評分:0 分。
在看完了 7 之后,此時此刻我的腦海里只有一句話:我在做什么?
估計 ChatGPT 還是很傻,不知道為什么我要這樣摧毀它。
必須說,能參加這樣的比賽,能在這樣的比賽中證明自己,都是大神。
從上面我和 ChatGPT 一人一模式互相扶著跌跌撞撞走過來的經(jīng)歷,現(xiàn)有的 AI 距離高數(shù)的推理學(xué)習(xí),還有很長的路要走。
但這并不意味著大型模型將被控制在數(shù)學(xué)領(lǐng)域的中學(xué)水平。作為一種工具,它更依賴于人類的實踐。
如同今年 1 月登上 Nature 谷歌爆裂級研究 DeepMind 的 AlphaGeometry,在 30 在問題范圍內(nèi),可以回答。 25 人類金牌獲得者平均水平解決了道國際數(shù)學(xué)奧林匹克幾何問題 25.9 個問題。
它已成為人類奧數(shù)的金牌級別。
而且這個勝利的背后,是 AlphaGeometry 該團隊構(gòu)建了神經(jīng)語言模型和符號演繹引擎兩個系統(tǒng),試圖提高模型推導(dǎo)能力。
這是 AlphaGeometry 成就,這更是人類優(yōu)越的成就。
做出理性的決策和判斷,同時具有豐富的情感和直覺感知。
然而,這類事情,離普通人肯定還有很長的路要走,但我們也有自己的小期望。
例如,GPT-5。
之前 Sam Altman 然后放出話來,GPT-5 將在高級推理功能上取得重大進展。
我很相信,OpenAI 至少不會在 GPT 在這個核心模型上,和我們打嘴炮。
縱使現(xiàn)在的 AI 仍然需要成長,但是,攀登者從不害怕成長。
正如姜萍對數(shù)學(xué)的向往一樣,正如我之前和大家分享的那些,因為喜歡而凌云登峰的可敬者。
所以,最后的問題來了:GPT-到底什么時候才能出來?
作者:數(shù)字生命卡茲克克
來源微信微信官方賬號:數(shù)字生命卡茲克(ID:Rockhazix)
題圖來自 Unsplash ,基于 CC0 協(xié)議
品牌推廣| 內(nèi)容編寫|廣告營銷|培訓(xùn)合作
請到微信官方賬號后臺回復(fù) 合作
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




