亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)

行業(yè)趨勢
2022-12-02

全真互聯(lián)時代正在悄然到來,加速線上線下的跨時空融合,作為全真互聯(lián)的重要入口,數(shù)字人可以推動線上和線下更加全面地一體化,打造出沉浸式的“全真”體驗與可操作的“互聯(lián)”交互。 

 

進(jìn)入2022年以來,數(shù)字人在諸多應(yīng)用場景大放光彩,特別是在北京冬奧會的開幕式表演、氣象播報、手語解說中頻頻現(xiàn)身,使其用戶基礎(chǔ)不斷擴大。爆點事件推動數(shù)字人產(chǎn)業(yè)被用戶不斷加深認(rèn)知,數(shù)字人形態(tài)、技術(shù)及應(yīng)用受到大量關(guān)注,而支持產(chǎn)業(yè)快速發(fā)展的底層元素則包括技術(shù)的發(fā)展、用戶新需求、生態(tài)完善和標(biāo)準(zhǔn)的支持等。 

 

 

伴隨著全真互聯(lián)的到來,未來數(shù)字人應(yīng)用還將具有哪些可能性,技術(shù)路線會產(chǎn)生哪些變化? 騰訊研究院、騰訊云智能創(chuàng)業(yè)黑馬合作,先后對數(shù)十家從事數(shù)字人的企業(yè)進(jìn)行深度調(diào)研與跟蹤訪談 ,分析產(chǎn)業(yè)發(fā)展現(xiàn)狀,底層驅(qū)動力、未來方向和挑戰(zhàn)等。形成《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)》 (文末附下載二維碼) 。從數(shù)字人的價值定位、核心技術(shù)、行業(yè)應(yīng)用、C端發(fā)展、產(chǎn)業(yè)聚集 等十個不同維度進(jìn)行剖析,挖掘出產(chǎn)業(yè)發(fā)展的十大趨勢。 

 

 

趨勢1:數(shù)字人制造和運營服務(wù)的B端市場不斷擴大,將面向更廣大的C端用戶提供服務(wù),各類數(shù)字人價值定位和商業(yè)模式有差異。

 

數(shù)字人的最終服務(wù)對象為C端用戶,在B端的應(yīng)用領(lǐng)域從電影動畫向廣告營銷、電商直播、虛擬偶像等領(lǐng)域不斷擴展。未來,以虛擬分身為代表的應(yīng)用潛力巨大。從需求角度,數(shù)字人制造和運營服務(wù)在B端市場不斷擴大領(lǐng)域和規(guī)模,面向更廣大的C端用戶提供服務(wù),而制作方式也從PGC向UGC發(fā)展。 

 

在20世紀(jì)80年代電影、動畫等領(lǐng)域早期的手繪數(shù)字人最先出現(xiàn),伴隨著21世紀(jì)初計算機動畫和動捕技術(shù)的成熟,內(nèi)容/IP型數(shù)字人大量應(yīng)用在影視行業(yè)中,主要是增強影視中觀眾的體驗效果,隨后逐漸在文娛、市場營銷、文旅、虛擬偶像等場景推廣應(yīng)用。近年,伴隨AI驅(qū)動技術(shù)的成熟,功能服務(wù)型數(shù)字人陸續(xù)出現(xiàn),主要應(yīng)用于行業(yè)服務(wù)場景,如金融數(shù)字人客服、傳媒數(shù)字人口播等。在虛擬空間中的虛擬分身數(shù)字人大范圍出現(xiàn)相對較晚,虛擬空間的技術(shù)和產(chǎn)品還在發(fā)展中,待產(chǎn)業(yè)進(jìn)一步完善,此類應(yīng)用潛力巨大,是數(shù)字人市場的增量空間。 

 

 

 

 

趨勢2:技術(shù)集綜合迭代驅(qū)動數(shù)字人形似人,制作效能將繼續(xù)提升。

 

多元技術(shù)推動數(shù)字人外形更像真人:建模技術(shù)發(fā)展推動超寫實數(shù)字人制作門檻、成本和周期進(jìn)一步下降;物理仿真算法迭代推動服裝動態(tài)展示趨向真實;渲染引擎迭代和GPU算力提升推動數(shù)字人畫面更加精細(xì)和實時化;算法的優(yōu)化推動專業(yè)動捕設(shè)備趨向便捷化,視覺動捕在C端應(yīng)用潛力更大;面部捕捉技術(shù)向更簡單的硬件、更細(xì)膩的表情、更自動化的流程方向發(fā)展。 

 

 

趨勢3:AI技術(shù)驅(qū)動數(shù)字人多模態(tài)交互更神似人,并逐步覆蓋數(shù)字人全流程。

 

當(dāng)前數(shù)字人對語言理解還是以文本為主,動作合成上聲唇同步較為完善: 

 

(1)AI驅(qū)動數(shù)字人是指數(shù)字人等語音表達(dá)、面部表情和動作形態(tài)等通過深度學(xué)習(xí)模型進(jìn)行運算,并將其結(jié)果實時或者離線驅(qū)動,并進(jìn)行渲染。目前主流的 方式是圍繞NLP能力通過文本驅(qū)動,本質(zhì)是通過ASR-NLP-TTS等AI技術(shù)進(jìn)行感知-決策-表達(dá)的閉環(huán)來驅(qū)動數(shù)字人交互,同時需要預(yù)先設(shè)置相關(guān)的知 識圖譜或問答庫等,與數(shù)字人的對話系統(tǒng)對接,但目前NLP在通用性場景的能力還需要進(jìn)一步完善。  

 

(2)計算機視覺(CV)目前數(shù)字人聲唇同步技術(shù)相對完善,在游戲中已經(jīng)大量應(yīng)用;而其他表情和動作還需要描述性的數(shù)據(jù)或者標(biāo)簽驅(qū)動,尚未智能合成, 表情動作也是是AI驅(qū)動未來發(fā)展的重點方向。  

 

未來AI技術(shù)的重點方向是在輸入端實現(xiàn)多模態(tài)感知輸入,在輸出端提升多模態(tài)交互能力,綜合提升數(shù)字人的表現(xiàn)力,從目前的基于文本的交互,轉(zhuǎn)化為基 于語義的交互,特別是需要強化對人情緒的感知和表達(dá)。此外除了利用ASR-NLP-TTS等技術(shù)驅(qū)動數(shù)字人交互外,AI技術(shù)也應(yīng)用在2D數(shù)字人的視頻生成、3D數(shù)字人的建模、視頻驅(qū)動、物理仿真等多個環(huán)節(jié)。 

 

 

 

 

 

趨勢4:數(shù)字人技術(shù)與SLAM、3D交互、體積視頻、空間音頻等技術(shù)深度融合,渲染將從本地到云端。

 

數(shù)字人作為3D呈現(xiàn)的一種方式,未來將與其他3D技術(shù)如SLAM(即時定位與地圖構(gòu)建)、體積視頻、空間音頻等融合,進(jìn)一步完善數(shù)字人和真實空間的交互。例如在直播場景中虛擬/真實空間中真人和數(shù)字人的交互,數(shù)字人對真實空間的感知等。同時由于數(shù)字人對渲染能力要求較高,未來云端渲染是重要的方向,將推動云服務(wù)商從算力(CPU)云服務(wù),到渲染力(GPU)的云服務(wù)。但成本仍是云渲染普及的關(guān)鍵阻礙,需要突破。 

 

 

趨勢5:千行千面的數(shù)字人將成為人機交互新入口,但深度上仍需挖掘。

 

AI驅(qū)動的數(shù)字人通過AI能力建立人與大數(shù)據(jù)的連接,提高效率并滿足人情感交流需求,提升用戶體驗,將成為人機交互新入口:應(yīng)用廣度上:目前使用文字或語音交互的場景都可用AI數(shù)字人軟著陸的方式替代,不需要改變原有的業(yè)務(wù)邏輯和商業(yè)模式,大眾接受成本較低,并提供更好的用戶體驗,未來應(yīng)用場景非常廣泛,可以與各種領(lǐng)域相結(jié)合,服務(wù)規(guī)模化和標(biāo)準(zhǔn)化。應(yīng)用深度上:數(shù)字人作為企業(yè)的數(shù)字資產(chǎn),是對員工工作的增強,具有生產(chǎn)力的屬性,可以進(jìn)一步釋放生產(chǎn)力,同時降本增效。未來數(shù)字人將根據(jù)不同行業(yè)的業(yè)務(wù)特點和應(yīng)用場景進(jìn)行更深度結(jié)合,孵化千行千面的數(shù)字員工,提供差異化服務(wù)。 

 

 

 

趨勢6:UGC數(shù)字人將加速出現(xiàn),成為未來產(chǎn)業(yè)的增量空間。

 

未來1-2年技術(shù)門檻和成本將快速下降,會出現(xiàn)更開放的創(chuàng)作者生態(tài)、更豐富的UGC內(nèi)容和商業(yè)模式,UGC將成為數(shù)字人的增量空間,同時也是數(shù)字人在C端應(yīng)用的主要生產(chǎn)方式 

 

 

 

趨勢7:數(shù)字人仍以2D顯示設(shè)備為主,3D顯示設(shè)備成為特定領(lǐng)域的新解法。

 

數(shù)字人的顯示載體包括手機、平板電腦、AR/VR眼鏡、智慧大屏或線下一體機等多種終端設(shè)備。PC、手機、智慧大屏、銀行VTM機等2D主流顯示設(shè)備仍是數(shù)字人顯示的主要載體。數(shù)字人和3D的數(shù)字內(nèi)容,對于裸眼3D、VR、AR等3D顯示設(shè)備的普及具有推動重要。特別在VR/AR設(shè)備中,6dof交互更突出數(shù)字人特點,因此會在特定領(lǐng)域成為新解法,如在XR設(shè)備中的線上演唱會、展會和會議等應(yīng)用場景。 

 

 

趨勢8:在場是數(shù)字人發(fā)展的高級階段,將與應(yīng)用場景深度耦合。

 

離線階段--目前數(shù)字人產(chǎn)業(yè)正處于快速發(fā)展期間:離線渲染、非交互類型的數(shù)字人仍是主流,在數(shù)字化營銷、文娛等領(lǐng)域應(yīng)用廣泛;AI驅(qū)動的數(shù)字人在行業(yè)服務(wù)中,虛擬分身數(shù)字人在虛擬空間中處于爆發(fā)前期。在線階段--伴隨數(shù)字人快速發(fā)展和大量使用,用戶將很快進(jìn)入體驗突破階段,在此階段利用AI驅(qū)動提供初級的實時交互和實時渲染技術(shù)不斷突破在場階段--實時交互,更加智能的數(shù)字人,并結(jié)合更深的行業(yè)理解,帶來更真實的沉浸感和更大的價值。 

 

 

趨勢9:藝術(shù)和技術(shù)雙輪驅(qū)動,北京有望成為產(chǎn)業(yè)新高地。

 

作為科技產(chǎn)品,數(shù)字人需要技術(shù)研發(fā)、人工智能、產(chǎn)品設(shè)計、運營、融資環(huán)境等多方面人才,因此互聯(lián)網(wǎng)發(fā)展較好的區(qū)域,如北京、杭州、上海、深圳等互聯(lián)網(wǎng)和數(shù)字內(nèi)容高地,將成為數(shù)字人產(chǎn)業(yè)的重要聚居地。在眾多因素中,藝術(shù)和科技是最強驅(qū)動力,北京藝術(shù)資源相對集中,擁有中國傳媒大學(xué)、中央美術(shù)學(xué)院頭部藝術(shù)類院校和專家資源;科技產(chǎn)業(yè)優(yōu)勢突出,互聯(lián)網(wǎng)企業(yè)數(shù)量較多,聚集了大量技術(shù)研發(fā)、AI算法等方面的人才;同時政府高度重視數(shù)字人產(chǎn)業(yè),第一個發(fā)布數(shù)字人發(fā)展政策。在產(chǎn)業(yè)和政策的推動下,有望成為數(shù)字人產(chǎn)業(yè)聚焦的新高地。 

 

 

趨勢10.:數(shù)字人版權(quán)保護(hù)及行業(yè)合規(guī)體系需同步建設(shè),推動實現(xiàn)可用、可靠、可知、可控。

 

數(shù)字人行業(yè)總體還在快速發(fā)展階段,發(fā)展和生存是企業(yè)的重點和方向,數(shù)字人著作權(quán)、外觀設(shè)計專利、商標(biāo)等知識產(chǎn)權(quán)保護(hù)體系亟待完善。 

 

面向未來,數(shù)字人會正朝幾個方向加速迭代:一是外貌更加精致,形象更加逼真,動作更加自然,即“皮囊更好看”,跨越恐怖谷效應(yīng)后,會使人覺得數(shù)字人和真人無異,有利于建立良好的心理連接;二是隨著AI技術(shù)的不斷完善,數(shù)字人多模態(tài)感知和交互的能力會得到顯著提升,數(shù)字人未來有可能具備記憶力和判斷力,從而更加智能,行為和思想上更趨于接近人,擁有“有趣的靈魂”。此外,數(shù)字人產(chǎn)業(yè)的加速發(fā)展,也需要渲染、動捕等行業(yè)開發(fā)工具、云渲染等技術(shù)支持體系的進(jìn)一步完善,從而大幅提升制作效能,有效降低制作時間和成本。目前,很多技術(shù)已經(jīng)接近商業(yè)化大規(guī)模推廣的臨界點,數(shù)字人產(chǎn)業(yè)有望進(jìn)入全真互聯(lián)的新階段:將可能作為我們的分身,成為數(shù)字世界的交互入口,為我們帶來更智能、更沉浸的“在場”體驗。 

 

 

版權(quán)說明:
本文僅代表作者個人觀點,版權(quán)歸原創(chuàng)者所有。部分圖片源自網(wǎng)絡(luò),未能核實歸屬。本文僅為分享,不為商業(yè)用途。若錯標(biāo)或侵權(quán),請與我們聯(lián)系刪除。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com