亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

阿里Qwen3能成為下一個DeepSeek嗎?

05-08 11:03

四月二十九日凌晨,阿里巴巴旗下的通義千問團隊正式發(fā)布并開源新一代模型Qwen3。這次發(fā)布的Qwen3系列包括兩個參數(shù)規(guī)模為30B和235B的混合專家。(MoE)模型,以及6個參數(shù)從0.6B到32B的密集模型。


作為中國第一個混合推理模型家族,Qwen3能否成為下一個DeepSeek,一經(jīng)推出就迅速引發(fā)了開源圈的熱議。


華為計算官方發(fā)布后不久,稱升騰MindSpeed和MindIE一直同步支持Qwen系列模型,這次Qwen3系列開源后,已經(jīng)在MindSpeed和MindIE中得到了開箱即用,完成了Qwen3的0Day適配。在海光信息方面,它的DCU很快就完成了8個模型的無縫適配和優(yōu)化。


“在發(fā)布的第二天,我們已經(jīng)完成了Qwen3-30B-A3的本地化部署。B,使用單卡4090,現(xiàn)在對C端用戶開放。COO王鵬告訴《IT時報》記者,共績算率COO,現(xiàn)在Qwen3的部署成本很低,Qwen3-235B-A22B只需要4張H20,而且小模型的部署成本更低。。另外,計算能力集群公司的工作人員告訴記者,Qwen3在發(fā)布的第二天就收到了客戶訂單。


與DeepSeek相比,成本大大降低,幻覺問題仍然沒有解決


Qwen3與之前的模型相比有了明顯的改進。


Qwen3在架構(gòu)上選擇混合專家。(MoE)以Qwen3-235B-A22B旗艦?zāi)P蜑槔倕?shù)高達235B,但激活只需22B,大大降低了運行時對計算能力的即時需求。


這種設(shè)計促使模型在面對不同復(fù)雜程度的任務(wù)后,能夠靈活準備計算資源,快速響應(yīng)簡單的問題,深入思考復(fù)雜的問題,實現(xiàn)“快思維”與“慢思維”的融合,兼顧效率和準確性,為模型應(yīng)用開辟了更廣闊的空間,有望改變行業(yè)適應(yīng)模型應(yīng)用領(lǐng)域的傳統(tǒng)思維。



預(yù)訓練數(shù)據(jù)量的增加也是Qwen3的一大亮點。根據(jù)官方數(shù)據(jù),其信息量是Qwen2.5的三倍。多輪強化學習的應(yīng)用巧妙地將非思維模式融入到思維模式中,提高了模型的智能處理邏輯,進一步提高了模型在推理、指令遵循、工具調(diào)用和多語言能力方面的表現(xiàn)。


Qwen3參數(shù)僅為其1/3,與DeepSeek-R1相比,成本大幅下降。就部署而言,Qwen3滿血版只需4張H20就可以部署,顯存只占性能相近模型的三分之一。王鵬說:“這大大降低了中小企業(yè)和個人開發(fā)者使用高性能模型的成本門檻和部署時間。


但也有不少AI愛好者在實際測量后在社交平臺上指出,Qwen3在長文本能力上的表現(xiàn)并不突出,有一定的幻覺率。然而,在生成復(fù)雜的代碼和數(shù)學推理方面,思維模式的表現(xiàn)明顯優(yōu)于非思維模式。《IT時報》記者試圖通過Qwen3網(wǎng)頁版生成關(guān)于“去年五一假期旅游數(shù)據(jù)與景區(qū)特色相關(guān)聯(lián)”的報告。Qwen3的“一般”模式?jīng)]有給出準確的數(shù)據(jù)支持,出現(xiàn)了很高的幻覺率。然而,在“深度思考”模式下,幻覺率大大降低,數(shù)據(jù)更加準確。


使用AI“雙子星”戰(zhàn)略,阿里渴望在C端站穩(wěn)腳跟。


當前AI跑道上,科技巨頭們的每一步都備受關(guān)注。


最近有傳言說,騰訊、阿里、字節(jié)跳動相繼結(jié)束,巨資爭奪GPU計算資源。雖然字節(jié)跳動已經(jīng)出來辟謠,說相關(guān)信息不真實,但這個謠言本身就足以反映出科技廠商對AI戰(zhàn)略布局的重視和渴望。


算率作為AI發(fā)展的基礎(chǔ),其重要性不言而喻。阿里此前公開表示,未來三年將在云和AI硬件基礎(chǔ)設(shè)施建設(shè)上投入超過3800億元。


目前,AI是阿里集團各業(yè)務(wù)領(lǐng)域的主要KPI。從阿里的整體AI戰(zhàn)略布局來看,對AI的投入不斷增加,試圖加強通義千問和夸克之間的“雙子星”格局。通義千問致力于支持云智能,而夸克則致力于打造端入口,共同推動阿里AI To C戰(zhàn)略的落地。


與以往最大的不同之處在于,“夸克”和“通義”已經(jīng)成為Qwen3的主要感受入口,所有用戶都可以免費使用這種最新的開源模式。



一位阿里內(nèi)部人士曾告訴《IT時報》記者:“通義App在C端沒有發(fā)出聲音,只能委以夸克的重任。


通義千問憑借在多模態(tài)處理和復(fù)雜任務(wù)推理方面的技術(shù)優(yōu)勢,為阿里的B端公司服務(wù)和開發(fā)者生態(tài)提供了有力支持。舉例來說,飛豬旅行借助通義千問多模態(tài)模型,完成了客戶方言語音規(guī)劃行程的功能;Rokid 配備AR眼鏡技術(shù)后,可實時翻譯。通義千問在模型開源方面跑得很快,但其“通義”App在C端應(yīng)用中并未施展“撒手锏”。


相反,夸克突出了重圍,第三方數(shù)據(jù)顯示,2025年3月,夸克的MAU(月活躍人數(shù))達到1.48億,在國內(nèi)AI應(yīng)用中排名第一。


從2024年底到2025年初,阿里通過一系列的組織結(jié)構(gòu)調(diào)整和人才布局,推動AI To C戰(zhàn)略將AI應(yīng)用“通義”并入智能信息業(yè)務(wù)群,整合天貓精靈和夸克團隊,聘請頂級AI科學家許主洪負責AI。 To C業(yè)務(wù)研發(fā)。


阿里AI戰(zhàn)略仍然存在許多挑戰(zhàn)。在保持技術(shù)優(yōu)勢的同時,通義千問如何進一步降低使用門檻,滿足中小企業(yè)多樣化的定制需求,成為亟待解決的難題。雖然其API(應(yīng)用程序編程接口)的價格具有一定的競爭力,但一些中小企業(yè)在技術(shù)對接和模型二次開發(fā)方面仍然面臨許多困難??淇艘裁媾R挑戰(zhàn)。隨著用戶數(shù)量的快速增長,感覺稀釋問題逐漸凸顯,流量增加時一些功能的響應(yīng)速度變慢,這就要求夸克提高技術(shù)結(jié)構(gòu)和服務(wù)器性能,保證用戶體驗的穩(wěn)定性。


AI市場競爭激烈。騰訊的混合元模型依托微信龐大的用戶基礎(chǔ)和生態(tài)優(yōu)勢,在微信多個入口中為元寶爭取亮相機會,為C端用戶形成“繭房式包裹”。2024年11月,憑借抖音的拉流優(yōu)勢,字節(jié)跳動旗下的豆包飆升至5998萬,幾乎長期占據(jù)AI應(yīng)用下載量榜前三。


雖然握著通義和夸克的“雙子星”,一條腿走進開源圈,一條腿走向C端用戶,但阿里AI戰(zhàn)略的前路在巨頭的包圍下依然充滿變數(shù)。


本文來自微信微信官方賬號 “IT時報”(ID:vittimes),作者:毛宇,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com