亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

Kimi首個萬億參數(shù)模型開源,免費(fèi)可用且推理能力強(qiáng),附實(shí)測感受

07-13 06:12

智東西


作者 | 陳駿達(dá)


編輯 | 心緣


據(jù)智東西7月12日消息,昨夜,國內(nèi)大模型獨(dú)角獸月之暗面發(fā)布并開源了其最新一代MoE架構(gòu)基礎(chǔ)模型Kimi K2,總參數(shù)量達(dá)1萬億(1T),激活參數(shù)為32B。Kimi K2已在Kimi Web端和App端可用。


Kimi K2是月之暗面首款開源發(fā)布的旗艦?zāi)P?,在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調(diào)用)這三項(xiàng)基準(zhǔn)測試中,取得了開源模型中的最優(yōu)成績。


在自主編程、工具調(diào)用和數(shù)學(xué)推理這三個能力維度上,Kimi K2的表現(xiàn)超過了DeepSeek - V3 - 0324、Qwen - 235B - A22B等模型,但在部分基準(zhǔn)測試中稍遜于Claude 4 Opus、OpenAI GPT - 4.1等模型。


Kimi K2在預(yù)訓(xùn)練階段采用“MuonClip”優(yōu)化器來訓(xùn)練萬億參數(shù)模型。該優(yōu)化器能提高Token利用效率,緩解高質(zhì)量人類數(shù)據(jù)短缺問題。月之暗面還運(yùn)用了大規(guī)模Agentic Tool Use數(shù)據(jù)合成和引入自我評價機(jī)制的通用強(qiáng)化學(xué)習(xí)等技術(shù)。


Kimi K2 API服務(wù)也同步上線。Kimi K2 API支持最長128K上下文,計(jì)費(fèi)方案為每百萬輸入tokens收費(fèi)4元,每百萬輸出tokens收費(fèi)16元,輸入輸出價格均是DeepSeek V3的2倍。


Kimi K2系列中的兩個模型版本現(xiàn)已開源,包括未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型Kimi - K2 - Base和通用指令微調(diào)版本Kimi - K2 - Instruct(非思考模型)。前者適合科研與自定義場景,后者可用于大多數(shù)問答與Agent任務(wù)。


Kimi K2現(xiàn)已上線無問芯穹Infini - AI異構(gòu)云平臺(cloud.infini - ai.com/genstudio/),用戶能以與官方API相同的價格調(diào)用Kimi K2。


開源鏈接:


https://huggingface.co/moonshotai/Kimi - K2 - Instruct


體驗(yàn)鏈接:


https://www.kimi.com/


一、編程能力有提升,但實(shí)測效果一般


根據(jù)月之暗面博客文章,在前端開發(fā)任務(wù)中,Kimi K2能生成有設(shè)計(jì)感和視覺表現(xiàn)力的代碼,支持粒子系統(tǒng)、可視化和3D場景等表現(xiàn)形式。官方Demo中,Kimi K2開發(fā)了一個支持晝夜循環(huán)的山川峽谷3D景觀:


還生成了粒子特效銀河:


為驗(yàn)證上述能力,智東西向Kimi K2發(fā)送了如下提示詞:


最終,Kimi K2交付的網(wǎng)頁渲染效果不如官方Demo中逼真,交互性和功能豐富度也稍差。


在難度較低的個人網(wǎng)站開發(fā)任務(wù)上,Kimi K2展現(xiàn)出一定規(guī)劃能力。在未收到明確指示時,Kimi K2主動梳理了網(wǎng)站的目錄結(jié)構(gòu),打造出的網(wǎng)站可擴(kuò)展性更好。


就智東西進(jìn)行的個人網(wǎng)站開發(fā)測試而言,Kimi K2相較Kimi K1.5的UI審美水平進(jìn)步不大。


上方為Kimi K2生成結(jié)果,下方為Kimi K1.5生成結(jié)果


同樣的任務(wù)交由DeepSeek - V3 - 0324處理,最終生成的結(jié)果如下:


二、Agent工具調(diào)用能力增強(qiáng),風(fēng)格化寫作能力擴(kuò)展


月之暗面稱,Kimi K2現(xiàn)具備復(fù)雜指令解析能力,可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的ToolCall結(jié)構(gòu)。


開發(fā)者可將Kimi K2接入owl、Cline、RooCode等Agent/Coding框架,完成復(fù)雜任務(wù)或自動化編碼。


Agent能力已可通過API使用,更多工具能力即將在Kimi上線。在月之暗面內(nèi)部測試環(huán)境的實(shí)際演示中,Kimi K2展現(xiàn)出一定的Agentic能力。


比如,將13萬行的原始數(shù)據(jù)交給Kimi K2,它可以幫用戶分析遠(yuǎn)程辦公比例對薪資的影響,分析顯著差異,自動生成統(tǒng)計(jì)圖表與回歸模型解讀,并用統(tǒng)一色調(diào)做出小提琴圖、箱線圖、散點(diǎn)圖等專業(yè)圖表,整理成報(bào)告


再比如,如果用戶是Coldplay粉絲,Kimi K2可以幫忙制定今年的追星計(jì)劃,完成演唱會所在城市的機(jī)酒與旅游規(guī)劃,并且生成日歷,再用html概括完整行程規(guī)劃并發(fā)送郵件。


Kimi K2還擁有了更強(qiáng)的風(fēng)格化寫作能力。官方提供的Demo中,Kimi K2模仿了蘋果廣告文案風(fēng)格:


此外,Kimi K2在通用知識推理、數(shù)學(xué)、規(guī)劃等任務(wù)中的表現(xiàn)也有提升,比數(shù)字大小的題目已經(jīng)難不住Kimi K2了。


結(jié)語:探索新型優(yōu)化器,未來將新增思考與視覺理解


根據(jù)月之暗面博客文章,Kimi K2用MuonClip優(yōu)化器支撐萬億參數(shù)模型訓(xùn)練,提升了token利用效率。結(jié)合大規(guī)模Agentic數(shù)據(jù)合成與通用強(qiáng)化學(xué)習(xí),這一模型的通用智能能力得到提升。


為緩解大規(guī)模訓(xùn)練中的attention logits偏大問題,月之暗面拋棄了傳統(tǒng)的Adam優(yōu)化器,提出MuonClip優(yōu)化器,并將其擴(kuò)展到萬億參數(shù)規(guī)模,提升了訓(xùn)練穩(wěn)定性和token使用效率。Kimi K2完成了15.5T token的訓(xùn)練,全程無loss spike。


月之暗面還構(gòu)建了可大規(guī)模生成多輪工具使用場景的合成pipeline,其大規(guī)模Agentic Tool Use數(shù)據(jù)合成可覆蓋數(shù)百領(lǐng)域、數(shù)千工具,樣本由LLM評估篩選后用于訓(xùn)練。


Kimi K2在可驗(yàn)證任務(wù)(代碼、數(shù)學(xué))上使用了強(qiáng)化學(xué)習(xí),還通過引入自我評價機(jī)制,解決了不可驗(yàn)證任務(wù)的獎勵稀缺問題,實(shí)現(xiàn)通用強(qiáng)化學(xué)習(xí),提升泛化任務(wù)表現(xiàn)。


目前,Kimi K2尚不支持視覺理解和思考能力,月之暗面稱這些能力將在未來陸續(xù)加入。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com