亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

開源3B推理模型,手機(jī)也能跑,性能超Qwen 3 - 4B且超長(zhǎng)上下文不降速

10-10 06:36

以色列一家初創(chuàng)企業(yè)開源了一款3B模型,其性能遠(yuǎn)超谷歌Gemma 3 - 4B。

以色列創(chuàng)企開源3B模型,性能碾壓谷歌Gemma 3 - 4B。


據(jù)智東西10月9日消息,昨日,以色列AI初創(chuàng)企業(yè)AI21 Labs開源了輕量級(jí)推理模型Jamba Reasoning 3B。該模型擁有30億個(gè)參數(shù),可在手機(jī)、電腦等多種設(shè)備端運(yùn)行,性能超越了Qwen3 - 4B、Gemma 3 - 4B等業(yè)界頂尖模型。

Jamba Reasoning 3B開源截圖

Hugging Face地址: http://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B


A21表示,Jamba Reasoning 3B基于新的SSM - Transformer架構(gòu)構(gòu)建,上下文窗口長(zhǎng)度為256K個(gè)token,能處理高達(dá)1M token,與DeepSeek、谷歌、Llama和微軟等競(jìng)爭(zhēng)對(duì)手相比,效率提升了2 - 5倍,在基準(zhǔn)測(cè)試中處于領(lǐng)先。

Jamba Reasoning 3B在人類最后測(cè)試等測(cè)評(píng)中超Qwen 3 - 4B等模型

該公司將Jamba Reasoning 3B的優(yōu)勢(shì)歸納為三點(diǎn)

1、智能性能不下降:由于采用混合SSM - Transformer架構(gòu),Jamba Reasoning 3B比純Transformer模型更高效。

大多數(shù)基于Transformer的模型在上下文長(zhǎng)度超過32K個(gè)token時(shí)性能會(huì)顯著下降,而Jamba Reasoning 3B能處理更長(zhǎng)的上下文長(zhǎng)度,包括高達(dá)100萬個(gè)token。這使其在高級(jí)智能體系統(tǒng)或多模態(tài)應(yīng)用中非常實(shí)用,因?yàn)殚L(zhǎng)上下文理解對(duì)輸出質(zhì)量至關(guān)重要。

Jamba Reasoning 3B的性能隨上下文增長(zhǎng)損耗小

2、領(lǐng)先的智能:Jamba Reasoning 3B的表現(xiàn)優(yōu)于DeepSeek、谷歌、Meta和微軟的其他設(shè)備端模型。

它在指令跟蹤任務(wù)(IFBench)和常識(shí)性知識(shí)(MMLU - Pro和Humanity's Last Exam)方面表現(xiàn)出色,這讓Jamba Reasoning 3B成為一款高效且智能的模型,可用于高級(jí)智能體工作流程或設(shè)備端RAG應(yīng)用。

這些成果得益于訓(xùn)練后流程,A21將RLVR、SFT、DPO和GRPO等對(duì)齊訓(xùn)練技術(shù)與自主研發(fā)的專有方法相結(jié)合,以確保模型質(zhì)量。

Jamba Reasoning 3B測(cè)評(píng)超阿里、谷歌等模型

3、專為設(shè)備安全使用而構(gòu)建:此模型獲得Apache 2.0許可,可直接下載到用戶的計(jì)算機(jī)或手機(jī)上,用戶能使用自己的文件在設(shè)備上進(jìn)行定制,以實(shí)現(xiàn)完全安全的應(yīng)用程序,即使斷網(wǎng)也能繼續(xù)運(yùn)行

Jamba Reasoning 3B的混合SSM - Transformer架構(gòu)成功利用了比原始Transformer架構(gòu)小8倍的鍵值緩存(KV),即使上下文增長(zhǎng)也能保持較低的內(nèi)存占用。

在M3 MacBook Pro上,它每秒可生成40個(gè)token,上下文長(zhǎng)度為32K,這一成績(jī)優(yōu)于Qwen3 - 4B、DeepSeek Distill Qwen 1.5B、Gemma 3 - 4B等模型,使其成為高級(jí)智能體應(yīng)用程序中的精簡(jiǎn)組件。

在M3 MacBook Pro上每秒可以生成40個(gè)token

該模型目前支持的語言有:英語、西班牙語、法語、葡萄牙語、意大利語、荷蘭語、德語、阿拉伯語和希伯來語。

結(jié)語:輕量模型加速迭代,開辟智能體落地新路徑

隨著企業(yè)將AI融入運(yùn)營(yíng),基于云端的大型語言模型暴露出經(jīng)濟(jì)效率低下的問題。A21援引研究報(bào)告稱,40% - 70%的AI任務(wù)可通過小型語言模型處理,通過智能路由可將成本降低10 - 30倍。

像Jamba Reasoning 3B這樣的設(shè)備端輕量模型能夠?qū)崿F(xiàn)經(jīng)濟(jì)高效的異構(gòu)計(jì)算分配,在本地處理簡(jiǎn)單任務(wù),同時(shí)保留云端資源用于復(fù)雜推理。這為制造業(yè)和醫(yī)療保健領(lǐng)域的實(shí)時(shí)應(yīng)用提供了低延遲,為遠(yuǎn)程操作提供了離線恢復(fù)能力,并增強(qiáng)了數(shù)據(jù)隱私保護(hù),有望開啟一個(gè)去中心化的AI時(shí)代。

本文來自微信公眾號(hào)“智東西”(ID:zhidxcom),作者:李水青,編輯:心緣 ,36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com