一月逆襲,安天科技大模型登頂世界第一
一個(gè)月前還位居第三,一個(gè)月后便拿下世界第一。10月8日,權(quán)威網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái)CyberSec - Eval更新了CS - Eval數(shù)據(jù)集的評(píng)測(cè)結(jié)果。其中,安天科技自主研發(fā)的“安天瀾砥威脅檢測(cè)分析垂直大模型(N2 - 1008版本)”表現(xiàn)卓越,以91.51的平均分綜合成績(jī)排名第一。并且,該模型在業(yè)務(wù)連續(xù)性與應(yīng)急響應(yīng)恢復(fù)、安全架構(gòu)設(shè)計(jì)、漏洞管理與滲透測(cè)試、AI與網(wǎng)絡(luò)安全評(píng)測(cè)四個(gè)單項(xiàng)中,取得第一名或與第一名持平的成績(jī)。

▲ CyberSec - Eval綜合排名TOP10
據(jù)介紹,CyberSec - Eval(CS - Eval)是目前國(guó)內(nèi)外最具代表性與專業(yè)性的網(wǎng)絡(luò)安全大模型評(píng)測(cè)基準(zhǔn)之一。它由阿里安全、復(fù)旦大學(xué)、中國(guó)科學(xué)院大學(xué)聯(lián)合構(gòu)建,于2024年上線。該評(píng)測(cè)平臺(tái)覆蓋全面,測(cè)評(píng)貼近實(shí)戰(zhàn),聚焦真實(shí)安全場(chǎng)景下的理解、推理與決策能力評(píng)估,還采用標(biāo)準(zhǔn)化測(cè)試集與評(píng)分機(jī)制,為行業(yè)提供了可比對(duì)、可復(fù)現(xiàn)的參考依據(jù)。目前,已有一批知名研發(fā)機(jī)構(gòu)、互聯(lián)網(wǎng)安全團(tuán)隊(duì)、知名安全企業(yè)加入該平臺(tái)的測(cè)試。“安天瀾砥威脅檢測(cè)分析垂直大模型N2分支”于今年9月9日首次提交測(cè)試并于次日公開(kāi),當(dāng)時(shí)綜合排名進(jìn)入前三。經(jīng)過(guò)近30天的持續(xù)訓(xùn)練后,在10月8日以綜合成績(jī)91.51分登頂,獲得榜單綜合平均排名第一。
據(jù)了解,安天自主研發(fā)的瀾砥威脅檢測(cè)分析垂直大模型主要面向二進(jìn)制、腳本等對(duì)象進(jìn)行分析鑒定。該模型的訓(xùn)練數(shù)據(jù)涵蓋文件識(shí)別信息、判定信息、屬性信息、結(jié)構(gòu)信息、行為信息、主機(jī)環(huán)境信息、數(shù)據(jù)信息等。它支持對(duì)不同場(chǎng)景下向量特征進(jìn)行威脅判定,并輸出詳實(shí)的知識(shí)理解,形成適用于不同需求和場(chǎng)景的多形態(tài)檢測(cè)方式,提升后臺(tái)隱蔽威脅判定能力,進(jìn)一步為安全運(yùn)營(yíng)賦能。
目前,這一技術(shù)主要應(yīng)用于網(wǎng)絡(luò)安全的威脅檢測(cè)分析領(lǐng)域。在客戶側(cè),大模型作為安天引擎的增強(qiáng)插件,為安全產(chǎn)品提供更強(qiáng)的威脅檢測(cè)分析能力。
記者:劉首辰
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com