亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

AI“精算時(shí)代”開(kāi)啟,英偉達(dá)引領(lǐng)小型模型變革

08-20 06:54

AI領(lǐng)域,小型模型正迎來(lái)屬于它們的高光時(shí)刻。從能裝入智能手表的新AI視覺(jué)模型,到可在谷歌智能手機(jī)上運(yùn)行的模型,小型化、高效化已成為顯著趨勢(shì)。如今,英偉達(dá)也加入這一浪潮,帶來(lái)全新的小語(yǔ)言模型(SLM)——Nemotron - Nano - 9B - v2。這款模型不僅在選定基準(zhǔn)測(cè)試中達(dá)到同類最高性能,還具備讓用戶自由開(kāi)啟和關(guān)閉AI “推理” 的獨(dú)特能力,為AI應(yīng)用開(kāi)辟了新的想象空間。

“小” 模型從邊緣玩具到生產(chǎn)主力

過(guò)去三個(gè)月,AI圈的 “迷你軍團(tuán)” 接連發(fā)力。MIT子公司Liquid AI推出的視覺(jué)模型小巧到能裝入智能手表,提升了可穿戴設(shè)備的智能體驗(yàn);谷歌將Gemini - Nano塞進(jìn)Pixel 8手機(jī),讓移動(dòng)端AI能力實(shí)現(xiàn)質(zhì)的飛躍;英偉達(dá)帶著90億參數(shù)的Nemotron - Nano - 9B - v2登場(chǎng),將其部署在單張A10 GPU上,刷新了人們對(duì)小型模型的認(rèn)知。

這并非技術(shù)炫技,而是對(duì)成本、效率與可控性的精準(zhǔn)平衡。英偉達(dá)AI模型后訓(xùn)練主管Oleksii Kuchiaev表示,將參數(shù)從120億精簡(jiǎn)到90億是為了適配企業(yè)部署中常見(jiàn)的A10顯卡。這意味著參數(shù)大小不再是衡量模型優(yōu)劣的關(guān)鍵,投資回報(bào)率(ROI)才是重要指標(biāo)。

把思維鏈條做成可計(jì)費(fèi)功能

傳統(tǒng)大模型的 “黑盒思維” 是企業(yè)使用的痛點(diǎn),長(zhǎng)時(shí)間推理會(huì)使token賬單失控。而Nemotron - Nano - 9B - v2給出了解決辦法:在prompt中加入/think,模型會(huì)啟用內(nèi)部思維鏈逐步推導(dǎo);加入/no_think,則直接輸出答案;系統(tǒng)級(jí)的max_think_tokens功能能為思維鏈設(shè)定預(yù)算,精準(zhǔn)控制成本。

現(xiàn)場(chǎng)實(shí)測(cè)(官方報(bào)告)數(shù)據(jù)更能說(shuō)明問(wèn)題:

把「推理」從默認(rèn)能力變成可選項(xiàng),企業(yè)可以像買云硬盤(pán)一樣按思考深度付費(fèi)。

Transformer的「省油」補(bǔ)丁

9B模型能在長(zhǎng)上下文里打平70B,原因在于Mamba - Transformer混合架構(gòu)。用Mamba狀態(tài)空間層替換70%的注意力層,顯存占用降低40%;序列長(zhǎng)度與顯存呈線性關(guān)系,而非平方爆炸;128k token實(shí)測(cè)吞吐量比同尺寸純Transformer高2.3倍。Mamba不是取代Transformer,而是將其改造成省油的混動(dòng)引擎。

商業(yè)核彈:寬松許可證 + 零門(mén)檻商用

英偉達(dá)在許可協(xié)議上做到了 “三不要”:不要錢(qián),無(wú)版稅、無(wú)收入分成;不要談判,直接下載即可商用;不要法務(wù)焦慮,僅要求遵守可信AI護(hù)欄和出口合規(guī)。對(duì)比OpenAI的分級(jí)許可、Anthropic的使用上限,Nemotron - Nano - 9B - v2幾乎成了 “開(kāi)源界的AWS EC2”,極大降低了企業(yè)使用門(mén)檻。

場(chǎng)景切片:誰(shuí)最先受益?

任何邊緣/私有化場(chǎng)景,都多了一張「足夠聰明又付得起」的牌。

AI的「精算時(shí)代」正式開(kāi)幕

過(guò)去四年,我們見(jiàn)證了參數(shù) × 算力 = 性能的規(guī)律。如今,Nemotron - Nano - 9B - v2用90億參數(shù)告訴我們:架構(gòu) × 控制 × 許可證 = 可持續(xù)的AI經(jīng)濟(jì)。當(dāng)小型模型不斷發(fā)展,“小” 不再是技術(shù)妥協(xié),而是精打細(xì)算后的最優(yōu)解。

未來(lái),創(chuàng)業(yè)者們或許會(huì)自信宣稱:“我們用1/10的算力,做出了90%的效果,并且還能賺錢(qián)。” 這標(biāo)志著,AI的 “精算時(shí)代” 已正式拉開(kāi)帷幕。

本文來(lái)自微信公眾號(hào)“山自”,作者:Rayking629,36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com