對(duì)GPT-4Turbobo進(jìn)行標(biāo)記,商湯升級(jí)為“每日新5.0”。
·“每日新5.0”選擇混合專家架構(gòu),超過(guò)10TBtokens訓(xùn)練,覆蓋大量生成數(shù)據(jù),推理時(shí)前后窗口達(dá)到200K左右。在云、端、側(cè)全棧大模型產(chǎn)品矩陣中,智能終端使用的“商湯側(cè)大模型”可以滿足各種終端用戶對(duì)大模型技術(shù)的應(yīng)用需求。

GPT-4“每日新5.0”回答有趣的推理問(wèn)題。
四月二十三日,商湯科技董事長(zhǎng)兼CEO徐立在2024商湯行業(yè)交流日上發(fā)布了行業(yè)首個(gè)云、端、邊全棧大型產(chǎn)品矩陣,以滿足不同規(guī)模場(chǎng)景的應(yīng)用需求;升級(jí)“每日新SenseNova” 大模型系統(tǒng)5.0,綜合能力全面對(duì)標(biāo)GPT-4 Turbo。
“在規(guī)模定律的指導(dǎo)下,商湯不斷探索KRE(知識(shí)-推理-執(zhí)行)三層架構(gòu)的大模型能力,突破大模型能力的邊界。”徐立說(shuō),“每天都有新的SenseNova “5.0”(以下簡(jiǎn)稱“每日新5.0”)選擇混合專家架構(gòu)(MoE),超過(guò)10TBtokens訓(xùn)練,覆蓋大量生成數(shù)據(jù),推理時(shí)前后文窗口達(dá)到200K左右。本次更新主要提升知識(shí)、數(shù)學(xué)、推理和代碼能力,全面對(duì)標(biāo)GPT-4 Turbo。
在文科能力方面,提高了“每日新5.0”的創(chuàng)意寫(xiě)作能力、推理能力和總結(jié)能力。注入同樣的中文知識(shí)后,可以獲得更好的理解、總結(jié)和問(wèn)答,為教育、內(nèi)容行業(yè)等垂直應(yīng)用領(lǐng)域提供幫助。在科學(xué)能力方面,“每日新5.0”的數(shù)學(xué)能力、代碼能力和推理能力得到了提升,為金融、數(shù)據(jù)分析等場(chǎng)景的落地提供了基礎(chǔ)。
在多模態(tài)大模型權(quán)威綜合基準(zhǔn)測(cè)試MMBench中,“每日新5.0”的多模態(tài)能力排名第一,在MathVista中排名第一。、AI2D、ChartQA、TextVQA、DocVQA、在MMMU中取得領(lǐng)先成績(jī)。“每日新5.0”支持超清長(zhǎng)圖的分析與理解,文生圖的互動(dòng)生成,還可以實(shí)現(xiàn)跨文檔知識(shí)的提取和問(wèn)答總結(jié)的展示。
在商湯科技云、端、邊全棧大模型產(chǎn)品矩陣中,智能終端使用的“商湯側(cè)大模型”可以滿足各種終端用戶對(duì)大模型技術(shù)的應(yīng)用需求,中端平臺(tái)端大語(yǔ)言模型的推理速度可以實(shí)現(xiàn)18.3個(gè)字/s的平均生成速率,旗艦平臺(tái)可以實(shí)現(xiàn)78.3個(gè)字/s。擴(kuò)展模型還可以實(shí)現(xiàn)端端u200b的高效推理速度,端端LDM-AI擴(kuò)展技術(shù)在一個(gè)主流平臺(tái)上的推理速度小于1.5秒,支持導(dǎo)出1200萬(wàn)像素及以上的高清圖片,支持等比擴(kuò)展圖片、自由擴(kuò)展圖片、轉(zhuǎn)動(dòng)擴(kuò)展圖片等圖像編輯功能。

演示擴(kuò)圖功能。
大型產(chǎn)品矩陣還包括邊緣商品“商湯企業(yè)級(jí)大型一體機(jī)”,面向金融、代碼、醫(yī)療、政務(wù)等。,支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署。端云協(xié)同解決方案可以通過(guò)智能判斷協(xié)同發(fā)揮端云各自的優(yōu)勢(shì),在需要在線搜索或處理復(fù)雜場(chǎng)景時(shí)分流到云處理,部分場(chǎng)景側(cè)處理占80%以上,從而降低推理成本。在個(gè)人出行場(chǎng)景中,商湯大模型技術(shù)應(yīng)用于小米汽車SU7智能車艙。基于商湯云大模型解決方案,小米小愛(ài)為車主提供智能互動(dòng)體驗(yàn)。

文生視頻平臺(tái)。
商湯這么多年來(lái)做了很多視頻、感知、理解的技術(shù)內(nèi)容,商湯關(guān)注的是如何將視頻的形成做到可控。我們搭建了文化視頻平臺(tái),強(qiáng)調(diào)人物的可控性、情感表達(dá)、微表情等相關(guān)內(nèi)容。同時(shí),我們還強(qiáng)調(diào)動(dòng)作的可控性和互動(dòng)性。”徐立帶來(lái)了三個(gè)全部由大模型制作的視頻。未來(lái)可以通過(guò)輸入一段文字或者一個(gè)完整的描述來(lái)生成一個(gè)視頻。可以提前設(shè)置人物的服裝、發(fā)型和場(chǎng)景,保持視頻內(nèi)容的連接性和一致性?!拔覀儠?huì)在短時(shí)間內(nèi)發(fā)布,為您提供服務(wù)的視頻平臺(tái)?!?/p>
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com