亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<rt id="3k4i3"><small id="3k4i3"></small></rt>

<label id="3k4i3"></label>

<li id="3k4i3"></li>

開源3B推理模型，手機(jī)也能跑，性能超Qwen 3 - 4B且超長(zhǎng)上下文不降速

10-10 06:36

以色列一家初創(chuàng)企業(yè)開源了一款3B模型，其性能遠(yuǎn)超谷歌Gemma 3 - 4B。

以色列創(chuàng)企開源3B模型，性能碾壓谷歌Gemma 3 - 4B。

據(jù)智東西10月9日消息，昨日，以色列AI初創(chuàng)企業(yè)AI21 Labs開源了輕量級(jí)推理模型Jamba Reasoning 3B。該模型擁有30億個(gè)參數(shù)，可在手機(jī)、電腦等多種設(shè)備端運(yùn)行，性能超越了Qwen3 - 4B、Gemma 3 - 4B等業(yè)界頂尖模型。

Jamba Reasoning 3B開源截圖

Hugging Face地址： http://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B

A21表示，Jamba Reasoning 3B基于新的SSM - Transformer架構(gòu)構(gòu)建，上下文窗口長(zhǎng)度為256K個(gè)token，能處理高達(dá)1M token，與DeepSeek、谷歌、Llama和微軟等競(jìng)爭(zhēng)對(duì)手相比，效率提升了2 - 5倍，在基準(zhǔn)測(cè)試中處于領(lǐng)先。

Jamba Reasoning 3B在人類最后測(cè)試等測(cè)評(píng)中超Qwen 3 - 4B等模型

該公司將Jamba Reasoning 3B的優(yōu)勢(shì)歸納為三點(diǎn)：

1、智能性能不下降：由于采用混合SSM - Transformer架構(gòu)，Jamba Reasoning 3B比純Transformer模型更高效。

大多數(shù)基于Transformer的模型在上下文長(zhǎng)度超過32K個(gè)token時(shí)性能會(huì)顯著下降，而Jamba Reasoning 3B能處理更長(zhǎng)的上下文長(zhǎng)度，包括高達(dá)100萬個(gè)token。這使其在高級(jí)智能體系統(tǒng)或多模態(tài)應(yīng)用中非常實(shí)用，因?yàn)殚L(zhǎng)上下文理解對(duì)輸出質(zhì)量至關(guān)重要。

Jamba Reasoning 3B的性能隨上下文增長(zhǎng)損耗小

2、領(lǐng)先的智能：Jamba Reasoning 3B的表現(xiàn)優(yōu)于DeepSeek、谷歌、Meta和微軟的其他設(shè)備端模型。

它在指令跟蹤任務(wù)（IFBench）和常識(shí)性知識(shí)（MMLU - Pro和Humanity's Last Exam）方面表現(xiàn)出色，這讓Jamba Reasoning 3B成為一款高效且智能的模型，可用于高級(jí)智能體工作流程或設(shè)備端RAG應(yīng)用。

這些成果得益于訓(xùn)練后流程，A21將RLVR、SFT、DPO和GRPO等對(duì)齊訓(xùn)練技術(shù)與自主研發(fā)的專有方法相結(jié)合，以確保模型質(zhì)量。

Jamba Reasoning 3B測(cè)評(píng)超阿里、谷歌等模型

3、專為設(shè)備安全使用而構(gòu)建：此模型獲得Apache 2.0許可，可直接下載到用戶的計(jì)算機(jī)或手機(jī)上，用戶能使用自己的文件在設(shè)備上進(jìn)行定制，以實(shí)現(xiàn)完全安全的應(yīng)用程序，即使斷網(wǎng)也能繼續(xù)運(yùn)行。

Jamba Reasoning 3B的混合SSM - Transformer架構(gòu)成功利用了比原始Transformer架構(gòu)小8倍的鍵值緩存（KV），即使上下文增長(zhǎng)也能保持較低的內(nèi)存占用。

在M3 MacBook Pro上，它每秒可生成40個(gè)token，上下文長(zhǎng)度為32K，這一成績(jī)優(yōu)于Qwen3 - 4B、DeepSeek Distill Qwen 1.5B、Gemma 3 - 4B等模型，使其成為高級(jí)智能體應(yīng)用程序中的精簡(jiǎn)組件。

在M3 MacBook Pro上每秒可以生成40個(gè)token

該模型目前支持的語言有：英語、西班牙語、法語、葡萄牙語、意大利語、荷蘭語、德語、阿拉伯語和希伯來語。

結(jié)語：輕量模型加速迭代，開辟智能體落地新路徑

隨著企業(yè)將AI融入運(yùn)營(yíng)，基于云端的大型語言模型暴露出經(jīng)濟(jì)效率低下的問題。A21援引研究報(bào)告稱，40% - 70%的AI任務(wù)可通過小型語言模型處理，通過智能路由可將成本降低10 - 30倍。

像Jamba Reasoning 3B這樣的設(shè)備端輕量模型能夠?qū)崿F(xiàn)經(jīng)濟(jì)高效的異構(gòu)計(jì)算分配，在本地處理簡(jiǎn)單任務(wù)，同時(shí)保留云端資源用于復(fù)雜推理。這為制造業(yè)和醫(yī)療保健領(lǐng)域的實(shí)時(shí)應(yīng)用提供了低延遲，為遠(yuǎn)程操作提供了離線恢復(fù)能力，并增強(qiáng)了數(shù)據(jù)隱私保護(hù)，有望開啟一個(gè)去中心化的AI時(shí)代。

本文來自微信公眾號(hào)“智東西”（ID：zhidxcom），作者：李水青，編輯：心緣，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

自然堂赴港上市：71億背后的光環(huán)與挑戰(zhàn)

雙11快遞大戰(zhàn)今晚打響，旺季快遞是否會(huì)繼續(xù)漲價(jià)？

小米豪擲500億造“芯”背后的冷思考

微軟推出“游戲搭子”，先別急著用

又一“德華”火爆網(wǎng)絡(luò)，“全職奶舅”成網(wǎng)友心頭好？

項(xiàng)目推薦