對GPT-4Turbobo進行標記,商湯升級為“每日新5.0”。
·“每日新5.0”選擇混合專家架構,超過10TBtokens訓練,覆蓋大量生成數據,推理時前后窗口達到200K左右。在云、端、側全棧大模型產品矩陣中,智能終端使用的“商湯側大模型”可以滿足各種終端用戶對大模型技術的應用需求。

GPT-4“每日新5.0”回答有趣的推理問題。
四月二十三日,商湯科技董事長兼CEO徐立在2024商湯行業(yè)交流日上發(fā)布了行業(yè)首個云、端、邊全棧大型產品矩陣,以滿足不同規(guī)模場景的應用需求;升級“每日新SenseNova” 大模型系統5.0,綜合能力全面對標GPT-4 Turbo。
“在規(guī)模定律的指導下,商湯不斷探索KRE(知識-推理-執(zhí)行)三層架構的大模型能力,突破大模型能力的邊界?!毙炝⒄f,“每天都有新的SenseNova “5.0”(以下簡稱“每日新5.0”)選擇混合專家架構(MoE),超過10TBtokens訓練,覆蓋大量生成數據,推理時前后文窗口達到200K左右。本次更新主要提升知識、數學、推理和代碼能力,全面對標GPT-4 Turbo。
在文科能力方面,提高了“每日新5.0”的創(chuàng)意寫作能力、推理能力和總結能力。注入同樣的中文知識后,可以獲得更好的理解、總結和問答,為教育、內容行業(yè)等垂直應用領域提供幫助。在科學能力方面,“每日新5.0”的數學能力、代碼能力和推理能力得到了提升,為金融、數據分析等場景的落地提供了基礎。
在多模態(tài)大模型權威綜合基準測試MMBench中,“每日新5.0”的多模態(tài)能力排名第一,在MathVista中排名第一。、AI2D、ChartQA、TextVQA、DocVQA、在MMMU中取得領先成績?!懊咳招?.0”支持超清長圖的分析與理解,文生圖的互動生成,還可以實現跨文檔知識的提取和問答總結的展示。
在商湯科技云、端、邊全棧大模型產品矩陣中,智能終端使用的“商湯側大模型”可以滿足各種終端用戶對大模型技術的應用需求,中端平臺端大語言模型的推理速度可以實現18.3個字/s的平均生成速率,旗艦平臺可以實現78.3個字/s。擴展模型還可以實現端端u200b的高效推理速度,端端LDM-AI擴展技術在一個主流平臺上的推理速度小于1.5秒,支持導出1200萬像素及以上的高清圖片,支持等比擴展圖片、自由擴展圖片、轉動擴展圖片等圖像編輯功能。

演示擴圖功能。
大型產品矩陣還包括邊緣商品“商湯企業(yè)級大型一體機”,面向金融、代碼、醫(yī)療、政務等。,支持企業(yè)級千億模型加速和知識檢索硬件加速,實現本地化部署。端云協同解決方案可以通過智能判斷協同發(fā)揮端云各自的優(yōu)勢,在需要在線搜索或處理復雜場景時分流到云處理,部分場景側處理占80%以上,從而降低推理成本。在個人出行場景中,商湯大模型技術應用于小米汽車SU7智能車艙?;谏虦拼竽P徒鉀Q方案,小米小愛為車主提供智能互動體驗。
文生視頻平臺。
商湯這么多年來做了很多視頻、感知、理解的技術內容,商湯關注的是如何將視頻的形成做到可控。我們搭建了文化視頻平臺,強調人物的可控性、情感表達、微表情等相關內容。同時,我們還強調動作的可控性和互動性?!毙炝砹巳齻€全部由大模型制作的視頻。未來可以通過輸入一段文字或者一個完整的描述來生成一個視頻??梢蕴崆霸O置人物的服裝、發(fā)型和場景,保持視頻內容的連接性和一致性?!拔覀儠诙虝r間內發(fā)布,為您提供服務的視頻平臺?!?/p>
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com