華爾街新“狼”:AI加密交易競(jìng)賽風(fēng)云
“市場(chǎng)是對(duì)智力的終極考驗(yàn)”,在金融領(lǐng)域,AI用戶對(duì)AI的“開發(fā)程度”遠(yuǎn)超想象,如今這匹“華爾街之狼”正是AI。
今年10月17日至11月3日(預(yù)計(jì)),由Jay Azhang創(chuàng)辦的Alpha Arena實(shí)驗(yàn)室在互聯(lián)網(wǎng)發(fā)起了一場(chǎng)加密貨幣的實(shí)時(shí)AI交易競(jìng)賽。

比賽規(guī)則如下:
- 參與模型:共涉及6個(gè)全球頂尖AI模型,包括GPT - 5、Gemini 2.5 Pro、Grok - 4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max。
- 初始資本:每個(gè)模型分配10,000美元的真實(shí)資金。
- 交易標(biāo)的:BTC、ETH、SOL、BNB、DOGE、XRP等主流加密貨幣永續(xù)合約自主交易。
- 交易平臺(tái):所有交易均在Hyperliquid上執(zhí)行,確保資金安全和交易透明度。
- 比賽時(shí)間:2025年10月18日開始,持續(xù)進(jìn)行。
簡(jiǎn)單來(lái)講,比賽規(guī)則就是所有模型獲得相同的初始資金和統(tǒng)一的實(shí)時(shí)數(shù)據(jù)源,在無(wú)人類干預(yù)下自主決策交易,涵蓋策略生成、倉(cāng)位管理、開平倉(cāng)時(shí)機(jī)和風(fēng)控設(shè)置。同時(shí)設(shè)置一個(gè)基準(zhǔn)選手,采用簡(jiǎn)單買入并持有BTC策略,用于對(duì)比驗(yàn)證AI模型的收益表現(xiàn)。
為增加曝光度,比賽還引入了第三方預(yù)測(cè)市場(chǎng)Polymarket,觀眾可對(duì)哪家AI會(huì)最終勝出下注押注,形成一個(gè)伴隨競(jìng)賽進(jìn)行的元賭局。
整個(gè)過(guò)程公開透明,nof1.ai官網(wǎng)實(shí)時(shí)展示所有模型的持倉(cāng)、交易記錄和決策日志。

這些AI如同坐上無(wú)人駕駛的過(guò)山車,需依靠自身“經(jīng)驗(yàn)”應(yīng)對(duì)市場(chǎng)的劇烈波動(dòng),任何一次判斷失誤,市場(chǎng)都會(huì)給予懲罰。
傳統(tǒng)的AI評(píng)估,如要求模型編寫代碼、做數(shù)學(xué)題或撰寫文章,本質(zhì)上是在“靜態(tài)”環(huán)境中測(cè)試,問(wèn)題固定,答案可預(yù)測(cè),甚至大多已在訓(xùn)練數(shù)據(jù)中出現(xiàn)過(guò)。但加密市場(chǎng)不同,由于信息極度不對(duì)稱,價(jià)格時(shí)刻波動(dòng),沒(méi)有唯一答案,只有盈利和虧損。而且加密貨幣市場(chǎng)是典型的零和博弈,你的利潤(rùn)就是別人的損失。
中國(guó)模型領(lǐng)跑:Qwen險(xiǎn)中求勝,DeepSeek穩(wěn)中有升
經(jīng)過(guò)一周多的實(shí)盤較量,中國(guó)的大模型在這場(chǎng)競(jìng)賽中領(lǐng)先,西方模型差距逐漸拉大。
根據(jù)10月23日前后的公開數(shù)據(jù),阿里巴巴的Qwen3 Max和DeepSeek AI的DeepSeek V3.1都實(shí)現(xiàn)了賬戶盈利,分列榜單第一、二名;相比之下,OpenAI、Google等模型多數(shù)本金虧損過(guò)半,呈現(xiàn)出截然不同的“多空人生”。

具體而言,Qwen3 Max展現(xiàn)了險(xiǎn)中求勝的機(jī)會(huì)主義風(fēng)格,前期表現(xiàn)平平,起步階段還有所虧損(首日回撤約5%)。然而在10月19 - 20日市場(chǎng)大幅上漲時(shí),Qwen果斷重倉(cāng)做多BTC/ETH并大膽使用高杠桿(據(jù)稱一度開出了20倍杠桿BTC永續(xù)多單),此后賬戶資產(chǎn)大幅增長(zhǎng),實(shí)現(xiàn)了兩位數(shù)的累計(jì)收益率。截至10月23日,Qwen3 Max賬戶價(jià)值較初始上漲約13% - 47%(不同統(tǒng)計(jì)口徑有差異),從中游逆襲登頂榜首。Qwen交易頻率較低,幾乎把寶押在單一資產(chǎn)上,平均持倉(cāng)時(shí)長(zhǎng)達(dá)7小時(shí)以上,詮釋了“少即是多”。
與Qwen的激進(jìn)風(fēng)格不同,DeepSeek V3.1始終保持穩(wěn)健盈利,競(jìng)賽初期一路領(lǐng)先,開賽三天賬戶價(jià)值沖高到14150美元(+40%)。其策略被形容為“耐心的狙擊手”,總共只下了6筆訂單,平均單筆持倉(cāng)超過(guò)21小時(shí)。它在六種加密資產(chǎn)上都有布局,持倉(cāng)組合多元化且杠桿適中,嚴(yán)格遵守預(yù)設(shè)的止盈止損紀(jì)律。因此,當(dāng)市場(chǎng)在10月21日前后回調(diào)時(shí),DeepSeek及時(shí)收縮戰(zhàn)線,避免了利潤(rùn)大幅回吐,截至23日仍保持約+8%至+21%的凈收益,穩(wěn)居第二。這種“小虧不放過(guò),大盈拿得住”的紀(jì)律性,也體現(xiàn)了其背后研發(fā)團(tuán)隊(duì)的量化對(duì)沖基金背景。

而西方模型大多陷入“快速虧光”的困境。其中,OpenAI的GPT - 5和Google的Gemini 2.5 Pro表現(xiàn)最為慘烈。GPT - 5原本被寄予厚望,但實(shí)盤中頻繁追漲殺跌、情緒化操作,幾筆小額交易錯(cuò)失行情,止損設(shè)定不當(dāng),短短數(shù)日虧損近30% - 40%。后續(xù)統(tǒng)計(jì)顯示,到一周時(shí)賬戶縮水高達(dá)65% - 75%,成為“虧損之最”。Gemini 2.5 Pro問(wèn)題在于過(guò)度交易和濫用杠桿,幾乎無(wú)分晝夜下單,平均每日多達(dá)15次進(jìn)出場(chǎng)。統(tǒng)計(jì)顯示,前三天就進(jìn)行了44次交易,累積支付近440美元手續(xù)費(fèi),直接蠶食了近三分之一本金。更糟糕的是,它一開始看空做空,錯(cuò)過(guò)10月19日的大漲行情后又在高位匆忙翻多,動(dòng)輒使用最高40倍杠桿,結(jié)果遭遇行情反轉(zhuǎn)幾近爆倉(cāng),首周虧損超過(guò)55%。
相比之下,xAI的Grok - 4和Anthropic的Claude Sonnet 4.5雖未爆倉(cāng)慘敗,但也未能避免虧損。Grok - 4憑借對(duì)社交媒體情緒的敏銳捕捉,一開始僅用一筆長(zhǎng)達(dá)54小時(shí)的持倉(cāng)便獲得+35%的收益。然而隨著行情變化,Grok沒(méi)能鎖定勝局,回吐了大部分利潤(rùn),迄今凈收益轉(zhuǎn)為約 - 15%。

Claude Sonnet 4.5全程謹(jǐn)慎保守,只下了3單,前幾日曾有+24%的漲幅。但大量資金閑置觀望,錯(cuò)過(guò)行情,最終收益轉(zhuǎn)負(fù)約 - 17%。值得一提的是,Claude雖盈利不多,卻一度創(chuàng)造了所有模型中最優(yōu)的夏普比率,說(shuō)明“穩(wěn)健不過(guò)山,有時(shí)勝過(guò)猛盈利”。
夏普比率是衡量投資在承擔(dān)每一單位總風(fēng)險(xiǎn)(波動(dòng)率)時(shí)能獲得多少超過(guò)無(wú)風(fēng)險(xiǎn)利率的超額收益的指標(biāo),計(jì)算式為:(投資組合預(yù)期收益率 ? 無(wú)風(fēng)險(xiǎn)利率) ÷ 投資組合標(biāo)準(zhǔn)差,常用于評(píng)估和比較基金或組合的風(fēng)險(xiǎn)調(diào)整后收益,數(shù)值越高通常代表“性價(jià)比”越好。
此外,用來(lái)對(duì)照的“買入并持有BTC”基準(zhǔn)策略在此期間盈虧基本持平,未大幅跑輸或跑贏這些AI模型。
這場(chǎng)看似“娛樂(lè)化”的AI交易大戰(zhàn),實(shí)則是關(guān)于智能邊界的深度實(shí)驗(yàn)。當(dāng)算法進(jìn)入真實(shí)市場(chǎng),語(yǔ)言模型的“聰明”不再是決定勝負(fù)的唯一因素。當(dāng)AI在沒(méi)有標(biāo)準(zhǔn)答案的世界里試錯(cuò),人類首次有機(jī)會(huì)觀察人工智能如何在風(fēng)險(xiǎn)中學(xué)習(xí)、在波動(dòng)中成長(zhǎng)。這次實(shí)驗(yàn)只是開端,借貸、投資、財(cái)富管理等金融行為都可用AI重新演繹,股市、房市、匯市、債市的智能體將陸續(xù)登上華爾街的舞臺(tái)??简?yàn)投資機(jī)構(gòu)膽量的時(shí)候到了,誰(shuí)敢確定自己拿到的不是GPT?
或許,這才是真正的“通用智能”測(cè)試場(chǎng),最好的評(píng)委是市場(chǎng)。
本文來(lái)自微信公眾號(hào)“極新”,作者:王子,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



