螞蟻投資的生數(shù)科技完成數(shù)千萬元融資,并正在內(nèi)測數(shù)十億級大模型
ChatGPT 持續(xù)引發(fā)中國人工智能(AI)大模型賽道的投資熱潮。
鈦媒體 App 獨(dú)家獲悉,8 月 9 日,生成式 AI 公司北京生數(shù)科技有限公司(簡稱 " 生數(shù)科技 ")宣布完成數(shù)千萬元天使 + 輪融資,本輪由錦秋基金投資,資金將主要用于算法研發(fā)、產(chǎn)品開發(fā)和團(tuán)隊(duì)擴(kuò)充。
此前 6 月,生數(shù)科技宣布完成螞蟻集團(tuán)、BV 百度風(fēng)投、卓源資本近億元的天使輪融資,首輪融資后估值 1 億美金。而僅過去不到兩個(gè)月,生數(shù)科技又一次連續(xù)完成第二輪投資。(詳見鈦媒體 App 前文:《螞蟻、百度聯(lián)合投資 AIGC 賽道,生數(shù)科技首輪融資后估值 1 億美金》)
生數(shù)科技 CEO 唐家渝對鈦媒體 App 表示,公司正計(jì)劃打造百億級參數(shù)量的大模型。相較于其他團(tuán)隊(duì),生數(shù)的核心壁壘在于多模態(tài)大模型架構(gòu)的原創(chuàng)先進(jìn)性、持續(xù)的底層算法創(chuàng)新能力等,團(tuán)隊(duì)已研發(fā)出開源大模型 Unidiffuser。
"目前在文生圖場景中,我們的效果已經(jīng)達(dá)到了 Stable Diffusion 最新版基礎(chǔ)模型效果,但與 Midjourney 相比還有一定差距,主要是美學(xué)性方面,我們預(yù)計(jì)年底會達(dá)到 Midjourney 最新版的效果。" 唐家渝表示。
據(jù)悉,生數(shù)科技成立于 2023 年 3 月,是全球領(lǐng)先的生成式 AI 基礎(chǔ)設(shè)施及應(yīng)用提供商,由清華系 AI 公司瑞萊智慧 RealAI、螞蟻集團(tuán)和百度發(fā)起的 BV 百度風(fēng)投聯(lián)合孵化成立,致力于打造可控多模態(tài)通用大模型。唐家渝此前曾任瑞萊智慧副總裁。
產(chǎn)品方面,今年 3 月,生數(shù)科技團(tuán)隊(duì)已發(fā)布 9.5 億參數(shù)的開源多模態(tài)大模型 Unidiffuser,采用基于 Transformer 架構(gòu)的底層統(tǒng)一網(wǎng)絡(luò)框架 U-ViT,實(shí)現(xiàn)圖文模態(tài)之間的任意跨模態(tài)生成。
唐家渝告訴鈦媒體 App,目前,業(yè)界主要集中在解決兩大核心問題:一是讓模型能理解和對齊多種模態(tài)的數(shù)據(jù);二是使模型能生成各種模態(tài)的內(nèi)容。大多數(shù)方法仍然依賴于組合多個(gè)模型來處理多模態(tài)數(shù)據(jù),但 Unidiffuser 利用 U-ViT 架構(gòu),成功地將文本和圖像整合到一個(gè)框架中,而且其閉源版本還進(jìn)一步整合了 3D 和視頻內(nèi)容。
目前,生數(shù)科技團(tuán)隊(duì)的研發(fā)核心主要有兩方面:一是在 Unidiffuser 核心架構(gòu)設(shè)計(jì)的基礎(chǔ)上自主研發(fā)更高參數(shù)量的產(chǎn)業(yè)級大模型,在文本、圖像的基礎(chǔ)上融入 3D、視頻等更多模態(tài)數(shù)據(jù),現(xiàn)階段已實(shí)現(xiàn)百億數(shù)據(jù)、數(shù)十億參數(shù)規(guī)模的通用大模型內(nèi)測,支持文圖生成、3D 生成和視頻元素編輯等功能;二是基于底層通用模型能力,研發(fā)面向圖像創(chuàng)作、3D 資產(chǎn)創(chuàng)建等內(nèi)容創(chuàng)作場景打造 "AI 工具集 ",產(chǎn)品將于今年底前推出。
商業(yè)化方面,唐家渝向鈦媒體 App 透露,生數(shù)科技商業(yè)化路徑分兩部分:一方面是開發(fā)面向終端用戶的應(yīng)用,例如圖像創(chuàng)作助理、3D 資產(chǎn)生成平臺,以訂閱等形式收費(fèi);另一方面,面向 B 端機(jī)構(gòu),提供調(diào)用模型服務(wù)。
" 我們希望幫助個(gè)人用戶解決細(xì)分場景下的圖像創(chuàng)作需求,同時(shí)能實(shí)現(xiàn)高質(zhì)量效果。目前,我們一款內(nèi)測的產(chǎn)品就是定位個(gè)人圖像創(chuàng)作助理,圍繞更通用底層的圖像創(chuàng)造和編輯需求,真正做到言出法隨,讓用戶用特別簡單的指令和交互就能創(chuàng)造出理想的圖像。難點(diǎn)涉及到底層模型可控生成方面的技術(shù)突破,以及對于普通用戶在圖像創(chuàng)作和編輯需求意圖方面的深刻理解。" 唐家渝表示。
唐家渝認(rèn)為,相比語言類大模型,在多模態(tài)大模型方向,國內(nèi)與國外的研究都處于早期探索階段,并沒有形成明顯的差距,均面臨包括架構(gòu)層面解決多模態(tài)數(shù)據(jù)對齊、模態(tài)的統(tǒng)一和通用,以及大模型指令微調(diào)等問題,目前全球都還處于早期的技術(shù)研究和驗(yàn)證階段,所以國內(nèi)外差距不明顯。而且在某些工作方向,國內(nèi)已經(jīng)領(lǐng)先于國外。
值得注意的是,生數(shù)科技此輪投資方 " 錦秋基金 " 與字節(jié)跳動關(guān)系密切。該基金成立于 2022 年 3 月,由原字節(jié)跳動財(cái)務(wù)投資負(fù)責(zé)人楊潔 Janna 創(chuàng)立,創(chuàng)始成員多數(shù)來自于原字節(jié)跳動投資團(tuán)隊(duì)以及國內(nèi)頂級風(fēng)險(xiǎn)投資機(jī)構(gòu)和知名產(chǎn)業(yè)公司,專注于早期和成長期投資。早前,楊潔還曾供職于紅杉資本、深創(chuàng)投、同創(chuàng)偉業(yè)等。
目前,錦秋基金主要聚焦 AI 和出海領(lǐng)域,已投資海外電商服務(wù)平臺 Jet Commerce 等,并且楊潔在未來機(jī)器人、鯊魚菲特、零犀科技等多家企業(yè)有任職。
針對此次融資,錦秋基金投資副總裁鄭曉超表示,大模型和生成式 AI 正引領(lǐng)當(dāng)前最大的一波科技新浪潮,催生了全新的生產(chǎn)力工具和應(yīng)用產(chǎn)品的出現(xiàn),但其核心驅(qū)動力仍來自于底層模型的創(chuàng)新。生數(shù)科技團(tuán)隊(duì)不僅聚焦底層技術(shù)創(chuàng)新,擁有深度生成式模型的骨干網(wǎng)絡(luò)、高速采樣、可控生成等全棧研發(fā)能力,具備從 0 到 1 訓(xùn)練全球最大擴(kuò)散模型的深厚技術(shù)實(shí)力。同時(shí)在商業(yè)化產(chǎn)品探索層面,生數(shù)科技團(tuán)隊(duì)也具有極強(qiáng)的工程化能力和產(chǎn)品創(chuàng)新能力。
唐家渝表示,生成式 AI 技術(shù)將讓每個(gè)人都能更好地進(jìn)行表達(dá)和創(chuàng)造,當(dāng)想象力不再被局限,生產(chǎn)效率將大幅提升,傳統(tǒng)的生產(chǎn)關(guān)系和人機(jī)交互模式也將得以重塑。未來生數(shù)科技將持續(xù)打磨通用大模型和應(yīng)用產(chǎn)品,致力于通過不斷解放想象力進(jìn)而提升全人類的創(chuàng)造力和生產(chǎn)力。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com