亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

讓ChatGPT做姜萍的數(shù)學(xué)競賽題:它是愚蠢的,我也是愚蠢的。

2024-06-22

The following article is from 卡茲克的數(shù)字生命 Author 卡茲克的數(shù)字生命


本來以為再差也不會那么離譜,好家伙你直接給我這個?


———— / BEGIN / ————


最近有個叫姜萍的小姑娘火了。


不只是因為她進入了 2024 而且,由于她是阿里巴巴全球數(shù)學(xué)競賽決賽的入圍名單, 17 歲、93 分、全球第 12 名字。而且是前30名中唯一的女孩。


更加爆棚的是,是她的學(xué)校。


江蘇省漣水中等專業(yè)學(xué)校。


嗯,中專。


北大、劍橋、清華、清華、MIT、中國科學(xué)院等。


這所江蘇省漣水中等專業(yè)學(xué)校,讓人十分出戲。


并且她主修服裝設(shè)計。


這個時候,把我的人看得都麻木了。


今年是阿里全球數(shù)學(xué)競賽的第六屆,而姜萍,也是有史以來第一個進入決賽的中專學(xué)生。


網(wǎng)上鋪天蓋地,關(guān)于她的討論太多了。無論如何,在這里,先把膝蓋獻給小女孩。我希望她能越走越遠,爬上她理想的高峰。


同時也讓我對另一點很好奇,2024 阿里巴巴全球數(shù)學(xué)競賽,這是一場什么比賽?


接著我去查資料和題目。


才發(fā)現(xiàn)原來是馬爸爸。 2018 2008年開始的比賽,隨后阿里巴巴公益、達摩院將其打造成當(dāng)今世界上規(guī)模最大的在線數(shù)學(xué)競賽。


而且最有趣的是,今年的比賽,有一點非常創(chuàng)新,那就是支持, AI 團隊參賽。


然后有 563 支 AI 隊伍沖進去,但沒有一個入選。得分最高 34 分,跟人類第一 113 分差相當(dāng)遠,與姜萍相比。 93 分?jǐn)?shù)也有很大的距離。


看了一下 AI 小組名單,第一名是高中生,第二名是老熟人,特工宇宙。


但他們都采用了許多工程技術(shù)。


突然間,我對這次數(shù)學(xué)競賽的題目感興趣,只想看看題目有多難。


接著我把考題翻了出來。


第 1 題:


看到這個問題,我覺得自己剛才說話有點大聲。


腦子里就在幻視這個小同學(xué)獨闖迷蹤陣,有一個 6 一個樁,小同學(xué)迷失在迷蹤中,緩過神來發(fā)現(xiàn)怎么只有四個樁。不是問樁在哪里,而是問有多少小同學(xué)… ...


但沒關(guān)系,我有 AI,所以我什么也沒加 Prompt 和 Agent,就這樣直接把這張圖丟了 ChatGPT。


總而言之,看了一頓很厲害的導(dǎo)出之后,GG 了。


答案是 6,你整個 復(fù)制者12,對嗎?


老師告訴我們,考試的時候不要在第一題上浪費太多時間。然后冷靜地看第二個問題。


第 2 題:


我:好?。∵@個問題我會,戰(zhàn)機游戲!AABB 上上下下!完成了。


對于 ChatGPT,他讓我想起了那首歌,《全選》 C》。


全部錯誤,答案是 B 和 A。


第三個問題是人類和人工智能的選擇。


第 3 題:


我:這怎么會有立體效果?沒有,那個 Z,怎樣鏤空?數(shù)學(xué)試卷開始使用 Windows 藝術(shù)詞匯?整篇文章我看見一個濃密的,讓我的大腦變得濃密。


ChatGPT:


有相當(dāng)多的小字,一堆我看不懂的東西向上打招呼。雖然看不懂公式,但至少能看懂不同的音調(diào)。你的公式都和答案不一樣。


第 4 題:


我:是誰?!是誰釋放了我的大腦空咒… ...


對于 ChatGPT... 算了,它認慫了。


第 5 題:


我:多年的經(jīng)驗告訴我,字少事大。


果不其然,定睛一看,那個 R,又特別是藝術(shù)字。


沒有,答案里顯然有很多這樣的小音符。


那么問題來了,ChatGPT,你們的小音符呢?沒有小音符,你敢說你是對的嗎?


第 6 題:


我:好家伙終于認識了!五福我熟悉啊,每年的??ㄎ叶紩占饋怼?/p>


勉強蒙對 1/2,但整個過程是錯誤的。


的確純粹靠蒙。


繼續(xù)錯誤的第二個問題。


最后,來到最后一個問題。


第 7 題:


我:啊?


你們給我閱讀理解嗎?


你們不是音樂,不是小紅和小綠嗎?難道不是一起去樹下,搞笑樹下的搞笑果實,搞笑樹下的你和我?


對于 ChatGPT...


洗洗睡吧。


最后 ChatGPT 評分:0 分。


在看完了 7 之后,此時此刻我的腦海里只有一句話:我在做什么?


估計 ChatGPT 還是很傻,不知道為什么我要這樣摧毀它。


必須說,能參加這樣的比賽,能在這樣的比賽中證明自己,都是大神。


從上面我和 ChatGPT 一人一模式互相扶著跌跌撞撞走過來的經(jīng)歷,現(xiàn)有的 AI 距離高數(shù)的推理學(xué)習(xí),還有很長的路要走。


但這并不意味著大型模型將被控制在數(shù)學(xué)領(lǐng)域的中學(xué)水平。作為一種工具,它更依賴于人類的實踐。


如同今年 1 月登上 Nature 谷歌爆裂級研究 DeepMind 的 AlphaGeometry,在 30 在問題范圍內(nèi),可以回答。 25 人類金牌獲得者平均水平解決了道國際數(shù)學(xué)奧林匹克幾何問題 25.9 個問題。


它已成為人類奧數(shù)的金牌級別。


而且這個勝利的背后,是 AlphaGeometry 該團隊構(gòu)建了神經(jīng)語言模型和符號演繹引擎兩個系統(tǒng),試圖提高模型推導(dǎo)能力。


這是 AlphaGeometry 成就,這更是人類優(yōu)越的成就。


做出理性的決策和判斷,同時具有豐富的情感和直覺感知。


然而,這類事情,離普通人肯定還有很長的路要走,但我們也有自己的小期望。


例如,GPT-5。


之前 Sam Altman 然后放出話來,GPT-5 將在高級推理功能上取得重大進展。


我很相信,OpenAI 至少不會在 GPT 在這個核心模型上,和我們打嘴炮。


縱使現(xiàn)在的 AI 仍然需要成長,但是,攀登者從不害怕成長。


正如姜萍對數(shù)學(xué)的向往一樣,正如我之前和大家分享的那些,因為喜歡而凌云登峰的可敬者。


所以,最后的問題來了:GPT-到底什么時候才能出來?


作者:數(shù)字生命卡茲克克


來源微信微信官方賬號:數(shù)字生命卡茲克(ID:Rockhazix)


題圖來自 Unsplash ,基于 CC0 協(xié)議


品牌推廣| 內(nèi)容編寫|廣告營銷|培訓(xùn)合作


請到微信官方賬號后臺回復(fù)


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com