騰訊云正式發(fā)布AI Native向量數(shù)據(jù)庫,大幅企業(yè)數(shù)據(jù)處理效力
7月4日下午,騰訊云正式發(fā)布AI Native向量數(shù)據(jù)庫Tencent Cloud VectorDB,可廣泛應用于大模型的訓練、推理、知識庫補充等場景。騰訊方面表示,這是國內(nèi)第一個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。
根據(jù)官方數(shù)據(jù)信息,騰訊云向量數(shù)據(jù)庫最高可支持10億級向量檢索規(guī)模,延遲控制在毫秒級;與傳統(tǒng)的單機插件數(shù)據(jù)庫相比,檢索規(guī)模擴大了10倍,同時還具有百萬級每秒查詢(QPS)的峰值能力。
“如果你看好AI模型,就應該看好向量數(shù)據(jù)庫”,騰訊云數(shù)據(jù)庫副總經(jīng)理羅云表示,隨著大模型的不斷發(fā)展和普及,AI原生數(shù)據(jù)庫將成為企業(yè)數(shù)據(jù)處理的標配。
向量數(shù)據(jù)庫通過向量化數(shù)據(jù),然后進行存儲和查詢,可以大大提高效率,降低成本,能解決大模型預訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,突破了大模型的時空限制,加速大模型在工業(yè)場景的落地。
騰訊官方數(shù)據(jù)顯示,使用騰訊云向量數(shù)據(jù)庫對大模型的預訓練數(shù)據(jù)進行分類、去重與清洗,相比傳統(tǒng)方法可以把效率提高10倍,如果把向量數(shù)據(jù)庫作為模型推理的外部知識庫,成本可以降低2-4個數(shù)量級。
羅云表示,騰訊云重新定義了AI Native的開發(fā)范式,提供了接入層、計算層、存儲層全面的AI解決方案,讓用戶在使用向量數(shù)據(jù)庫的全生命周期,都能借助AI能力。
具體來說,在接入層,騰訊云向量數(shù)據(jù)庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢模式,支持全內(nèi)存索引;在計算層,AI Native開發(fā)范式可以實現(xiàn)全量數(shù)據(jù)的AI計算,一站式解決企業(yè)構建私有領域知識庫時的文本切分(Segment)、向量化(Embedding )等難題;在存儲層,騰訊云向量數(shù)據(jù)庫支持數(shù)據(jù)的智能存儲分發(fā),降低企業(yè)50%的存儲成本。
根據(jù)騰訊官方信息,使用騰訊云向量數(shù)據(jù)庫后,企業(yè)接入大模型數(shù)據(jù)所需時間可從一個月縮減至三天左右,大大降低了企業(yè)的接入成本。
在產(chǎn)品商業(yè)化層面,羅云表示,目前可以單獨提供向量數(shù)據(jù)庫,未來不排除將向量數(shù)據(jù)庫和其他相關產(chǎn)品打包出售的可能。
在具體應用層面,騰訊稱,該數(shù)據(jù)庫基于騰訊每日處理千億次檢索的向量引擎(OLAMA),數(shù)據(jù)接入AI的效率比傳統(tǒng)方案高10倍,運行穩(wěn)定性達到99.99%,目前已應用于騰訊視頻、QQ瀏覽器、QQ音樂等30余款騰訊內(nèi)部的產(chǎn)品中。
以騰訊視頻的應用為例,視頻庫中的圖片、音頻、標題文字等內(nèi)容使用騰訊云向量數(shù)據(jù)庫,每月完成的檢索計算量高達200億次,可以滿足版權保護、原創(chuàng)識別、相似性檢索等場景需求。
從應用結果來看,向量數(shù)據(jù)庫可以直接提高運行效率。官方資料顯示,使用騰訊云向量數(shù)據(jù)庫后,QQ音樂人均收聽時長增加了3.2%、騰訊視頻有效曝光人均時長增加1.74%、QQ瀏覽器成本降低37.9%。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com