亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<code id="k8c00"><dd id="k8c00"></dd></code>

讓ChatGPT做姜萍的數(shù)學(xué)競賽題：它是愚蠢的，我也是愚蠢的。

2024-06-22

The following article is from 卡茲克的數(shù)字生命 Author 卡茲克的數(shù)字生命

本來以為再差也不會那么離譜，好家伙你直接給我這個？

———— / BEGIN / ————

最近有個叫姜萍的小姑娘火了。

不只是因為她進入了 2024 而且，由于她是阿里巴巴全球數(shù)學(xué)競賽決賽的入圍名單， 17 歲、93 分、全球第 12 名字。而且是前30名中唯一的女孩。

更加爆棚的是，是她的學(xué)校。

江蘇省漣水中等專業(yè)學(xué)校。

嗯，中專。

北大、劍橋、清華、清華、MIT、中國科學(xué)院等。

這所江蘇省漣水中等專業(yè)學(xué)校，讓人十分出戲。

并且她主修服裝設(shè)計。

這個時候，把我的人看得都麻木了。

今年是阿里全球數(shù)學(xué)競賽的第六屆，而姜萍，也是有史以來第一個進入決賽的中專學(xué)生。

網(wǎng)上鋪天蓋地，關(guān)于她的討論太多了。無論如何，在這里，先把膝蓋獻給小女孩。我希望她能越走越遠，爬上她理想的高峰。

同時也讓我對另一點很好奇，2024 阿里巴巴全球數(shù)學(xué)競賽，這是一場什么比賽？

接著我去查資料和題目。

才發(fā)現(xiàn)原來是馬爸爸。 2018 2008年開始的比賽，隨后阿里巴巴公益、達摩院將其打造成當(dāng)今世界上規(guī)模最大的在線數(shù)學(xué)競賽。

而且最有趣的是，今年的比賽，有一點非常創(chuàng)新，那就是支持， AI 團隊參賽。

然后有 563 支 AI 隊伍沖進去，但沒有一個入選。得分最高 34 分，跟人類第一 113 分差相當(dāng)遠，與姜萍相比。 93 分?jǐn)?shù)也有很大的距離。

看了一下 AI 小組名單，第一名是高中生，第二名是老熟人，特工宇宙。

但他們都采用了許多工程技術(shù)。

突然間，我對這次數(shù)學(xué)競賽的題目感興趣，只想看看題目有多難。

接著我把考題翻了出來。

第 1 題：

看到這個問題，我覺得自己剛才說話有點大聲。

腦子里就在幻視這個小同學(xué)獨闖迷蹤陣，有一個 6 一個樁，小同學(xué)迷失在迷蹤中，緩過神來發(fā)現(xiàn)怎么只有四個樁。不是問樁在哪里，而是問有多少小同學(xué)… ...

但沒關(guān)系，我有 AI，所以我什么也沒加 Prompt 和 Agent，就這樣直接把這張圖丟了 ChatGPT。

總而言之，看了一頓很厲害的導(dǎo)出之后，GG 了。

答案是 6，你整個復(fù)制者12，對嗎？

老師告訴我們，考試的時候不要在第一題上浪費太多時間。然后冷靜地看第二個問題。

第 2 題：

我：好?。∵@個問題我會，戰(zhàn)機游戲！AABB 上上下下！完成了。

對于 ChatGPT，他讓我想起了那首歌，《全選》 C》。

全部錯誤，答案是 B 和 A。

第三個問題是人類和人工智能的選擇。

第 3 題：

我：這怎么會有立體效果？沒有，那個 Z，怎樣鏤空？數(shù)學(xué)試卷開始使用 Windows 藝術(shù)詞匯？整篇文章我看見一個濃密的，讓我的大腦變得濃密。

ChatGPT：

有相當(dāng)多的小字，一堆我看不懂的東西向上打招呼。雖然看不懂公式，但至少能看懂不同的音調(diào)。你的公式都和答案不一樣。

第 4 題：

我：是誰？！是誰釋放了我的大腦空咒… ...

對于 ChatGPT... 算了，它認慫了。

第 5 題：

我：多年的經(jīng)驗告訴我，字少事大。

果不其然，定睛一看，那個 R，又特別是藝術(shù)字。

沒有，答案里顯然有很多這樣的小音符。

那么問題來了，ChatGPT，你們的小音符呢？沒有小音符，你敢說你是對的嗎？

第 6 題：

我：好家伙終于認識了！五福我熟悉啊，每年的?？ㄎ叶紩占饋怼?/p>

勉強蒙對 1/2，但整個過程是錯誤的。

的確純粹靠蒙。

繼續(xù)錯誤的第二個問題。

最后，來到最后一個問題。

第 7 題：

我：啊？

你們給我閱讀理解嗎？

你們不是音樂，不是小紅和小綠嗎？難道不是一起去樹下，搞笑樹下的搞笑果實，搞笑樹下的你和我？

對于 ChatGPT...

洗洗睡吧。

最后 ChatGPT 評分：0 分。

在看完了 7 之后，此時此刻我的腦海里只有一句話：我在做什么？

估計 ChatGPT 還是很傻，不知道為什么我要這樣摧毀它。

必須說，能參加這樣的比賽，能在這樣的比賽中證明自己，都是大神。

從上面我和 ChatGPT 一人一模式互相扶著跌跌撞撞走過來的經(jīng)歷，現(xiàn)有的 AI 距離高數(shù)的推理學(xué)習(xí)，還有很長的路要走。

但這并不意味著大型模型將被控制在數(shù)學(xué)領(lǐng)域的中學(xué)水平。作為一種工具，它更依賴于人類的實踐。

如同今年 1 月登上 Nature 谷歌爆裂級研究 DeepMind 的 AlphaGeometry，在 30 在問題范圍內(nèi)，可以回答。 25 人類金牌獲得者平均水平解決了道國際數(shù)學(xué)奧林匹克幾何問題 25.9 個問題。

它已成為人類奧數(shù)的金牌級別。

而且這個勝利的背后，是 AlphaGeometry 該團隊構(gòu)建了神經(jīng)語言模型和符號演繹引擎兩個系統(tǒng)，試圖提高模型推導(dǎo)能力。

這是 AlphaGeometry 成就，這更是人類優(yōu)越的成就。

做出理性的決策和判斷，同時具有豐富的情感和直覺感知。

然而，這類事情，離普通人肯定還有很長的路要走，但我們也有自己的小期望。

例如，GPT-5。

之前 Sam Altman 然后放出話來，GPT-5 將在高級推理功能上取得重大進展。

我很相信，OpenAI 至少不會在 GPT 在這個核心模型上，和我們打嘴炮。

縱使現(xiàn)在的 AI 仍然需要成長，但是，攀登者從不害怕成長。

正如姜萍對數(shù)學(xué)的向往一樣，正如我之前和大家分享的那些，因為喜歡而凌云登峰的可敬者。

所以，最后的問題來了：GPT-到底什么時候才能出來？

作者：數(shù)字生命卡茲克克

來源微信微信官方賬號:數(shù)字生命卡茲克（ID：Rockhazix）

題圖來自 Unsplash ，基于 CC0 協(xié)議

品牌推廣｜內(nèi)容編寫｜廣告營銷｜培訓(xùn)合作

請到微信官方賬號后臺回復(fù) 合作

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

并非閃電皮娜沒有錢買，而是捷安特TCR SL1更具性價比！

野路子，沒有方向，晉升難？一張圖帶你建立產(chǎn)品經(jīng)理能力模型

228年來第一次！這個夏至不一般

別撿，別摘！大量出現(xiàn)在寧波街頭

年青人用腳，決定了奧康國際的命運。

項目推薦

愛親母嬰連鎖品牌

<fieldset id="iuu0w"><dd id="iuu0w"></dd></fieldset>