亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

階躍星辰發(fā)布新一代基礎大模型Step 3,成功搭載華為昇騰芯片

07-28 06:06

IT之家7月26日消息,在2025世界人工智能大會(簡稱“WAIC 2025”)開幕前夕,階躍星辰于昨日在上海正式發(fā)布了新一代基礎大模型——Step 3,并將于7月31日面向全球企業(yè)和開發(fā)者開源。


據(jù)官方介紹,Step 3是階躍星辰首個全尺寸、原生多模態(tài)推理模型,在兼顧模型效果與推理成本方面,是模型架構創(chuàng)新、算法工程協(xié)同設計上的大膽嘗試與規(guī)模升級。Step 3采用MoE架構,總參數(shù)量321B,激活參數(shù)量38B。


Step 3具備強大的視覺感知和復雜推理能力,能夠準確完成跨領域的復雜知識理解、數(shù)學與視覺信息的交叉分析,以及解決日常生活中的各類視覺分析問題。


Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08 - 2025.05)等榜單上,取得了開源多模態(tài)推理模型的最優(yōu)成績。


官方表示,目前主流開源模型雖針對解碼進行了大量優(yōu)化,但優(yōu)化方案主要適配國際高端芯片,在中端及國產(chǎn)芯片上的解碼效率仍有提升空間。在架構設計階段,Step 3充分考量系統(tǒng)與硬件的特性,實現(xiàn)了在廣泛硬件平臺上的高效推理。憑借系統(tǒng)和架構創(chuàng)新,Step 3達到了行業(yè)領先的推理解碼效率。


根據(jù)原理分析,Step 3在國產(chǎn)芯片上的推理效率最高可達DeepSeek - R1的300%,并且對所有芯片都很友好。在基于NVIDIA Hopper架構的芯片進行分布式推理時,實測Step 3相較于DeepSeek - R1的吞吐量提升超70%,且這些都是在不犧牲激活參數(shù)量、不降低注意力容量的條件下實現(xiàn)的。


階躍星辰宣布聯(lián)合近10家芯片及基礎設施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。目前,華為昇騰芯片已首先實現(xiàn)Step 3的搭載和運行。沐曦、天數(shù)智芯和燧原等也已初步實現(xiàn)運行Step 3,其它聯(lián)盟廠商的適配工作正在進行中。


本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com