亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

比真人還“搶鏡”,虛擬數(shù)字人會是流量明星的對手嗎?

商界觀察
2022-11-11

2012年7月12日,中國第一個虛擬偶像洛天依出道,她推出了《普通Disco》《東京不太熱》等知名歌曲,登上了北京冬奧的舞臺,在B站上擁有近300萬粉絲。

 

圖|洛天依

 

在海外的Instagram平臺上,Lil Miquela是一位來自美國洛杉磯的19歲虛擬偶像博主,擁有298萬粉絲。她擁有巴西與西班牙的血統(tǒng),標(biāo)志性的造型是齊劉海、雀斑和雙丸子頭,經(jīng)常與Gucci、Chanel等大牌合作。

 

圖|Lil Miquela

 

實際上,在我國近年來發(fā)展迅速的視頻平臺上,涌現(xiàn)出了許多知名的虛擬數(shù)字人:會捉妖的美妝達(dá)人柳夜熙、虛擬偶像團(tuán)體A-Soul、清華的虛擬學(xué)生華智冰等等。

 

虛擬數(shù)字人的產(chǎn)業(yè)迅速發(fā)展起來。

 

美國著名的科幻作家尼爾·斯蒂芬森曾在其1992年出版的小說《雪崩》中,描繪了一個在現(xiàn)實世界之外的、由電腦和網(wǎng)絡(luò)構(gòu)成的賽博空間Metaverse,這也是如今爆火的「元宇宙」概念的起源。

 

對于一個Metaverse來說,所有現(xiàn)實世界的人在Metaverse中都有一個替身(Avatar),而虛擬數(shù)字人正是人類進(jìn)入這個未來的數(shù)字世界的入口。

 

本期《GGV投資筆記》,將與大家分享關(guān)于虛擬數(shù)字人的研究。

 

 

什么是虛擬數(shù)字人?

 

虛擬數(shù)字人是近年來出現(xiàn)的較為新穎的概念,因此沒有一個統(tǒng)一且確定的概念界定。

 

從最基本的詞義拆解來看,虛擬數(shù)字人包括「虛擬」和「數(shù)字」兩個基礎(chǔ)概念。所謂「虛擬」的人,強(qiáng)調(diào)人物身份虛構(gòu)、通過計算機(jī)圖形學(xué)技術(shù)進(jìn)行虛擬制作且具備人類的外觀和行為模式的人;而所謂「數(shù)字」的人,則是指存在于數(shù)字世界,身份設(shè)定和外觀可以按照現(xiàn)實世界中的人物進(jìn)行設(shè)定。

 

總結(jié)來看,根據(jù)中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟總體組和中關(guān)村數(shù)智人工智能產(chǎn)業(yè)聯(lián)盟數(shù)字人工作委員會發(fā)布的《2020 年虛擬數(shù)字人發(fā)展白皮書》中對虛擬數(shù)字人的描述是:

 

與具備實體的機(jī)器人不同,虛擬數(shù)字人依賴顯示設(shè)備存在。虛擬數(shù)字人宜具備以下三方面特征:

 

一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;

二是擁有人的行為,具有用語言、面部表情和肢體動作表達(dá)的能力;

三是擁有人的思想,具有識別外界環(huán)境、并能與人交流互動的能力。

 

 

實際上,從廣義上來看,虛擬數(shù)字人的發(fā)展歷史由來已久。

 

早在20世紀(jì)80年代,人們就開始嘗試將虛擬人物引入到現(xiàn)實世界,比如1982年,世界上第一位虛擬歌姬林明美出現(xiàn)了,雖然當(dāng)時技術(shù)是以傳統(tǒng)的手繪為主,但顯示出了虛擬人概念的萌芽。在21世紀(jì)初,計算機(jī)技術(shù)飛速發(fā)展,CG(計算機(jī)動畫)技術(shù)和動作捕捉技術(shù)發(fā)展日益成熟,日本制作了第一個被廣泛認(rèn)可的虛擬偶像初音未來,對虛擬數(shù)字人的探索越來越豐富。

 

近5年來,隨著深度學(xué)習(xí)的算法取得突破,虛擬數(shù)字人的制作過程也得到了有效地簡化。2019年,浦發(fā)銀行和百度共同合作開發(fā)的銀行業(yè)首位數(shù)字員工正式亮相;2018年,搜狗與新華社聯(lián)合發(fā)布全球首個全仿真智能AI主持人。

 

而如今,隨著虛擬數(shù)字人上下游的技術(shù)全面提升與突破,虛擬數(shù)字人也朝著全面的智能化、便捷化、精細(xì)化、多樣化發(fā)展。2020年,三星旗下STAR Labs展示了其設(shè)計的虛擬數(shù)字人NEON,顯示出了虛擬數(shù)字人在當(dāng)下的飛速成長。

 

 

遍覽市面上的虛擬數(shù)字人,我們可以從外觀、技術(shù)和具體應(yīng)用場景三個角度來進(jìn)行分類。

 

從外觀上來看,我們可以大致分為三類,以洛天依、A-SOUL為代表的卡通類;以Lil Miquela、湖南主持人小漾為代表的寫實類;以及以清華華智冰、騰訊Siren為代表的超寫實類。

 

圖 | 虛擬數(shù)字人外觀的分類

 

從虛擬人制作技術(shù)的角度看,也可以分為三種。第一種,是以形象和語音合成實現(xiàn)的非交互型的虛擬數(shù)字人,以洛天依為代表;第二種,是近年來涌現(xiàn)出的以真人驅(qū)動實現(xiàn)的虛擬數(shù)字人,即虛擬背后有一個真人貢獻(xiàn)了聲音、動作等,以A-soul為代表,他們可以和用戶產(chǎn)生一些互動,但是互動的來源是背后的真人;第三種,是隨著AI技術(shù)的發(fā)展,出現(xiàn)的以AI驅(qū)動、能與用戶產(chǎn)生AI的對話,甚至能自動生成唇形表情的虛擬數(shù)字人,目前在市場上的AI驅(qū)動型的知名虛擬數(shù)字人還相對較少。

 

從具體的應(yīng)用上來看,虛擬數(shù)字人可以分為服務(wù)型虛擬數(shù)字人與身份型虛擬數(shù)字人。服務(wù)型虛擬數(shù)字人長應(yīng)用于虛擬客服、虛擬導(dǎo)師,帶貨主播等場景;而身份型虛擬數(shù)字人,則被常常用以打造一些可供運(yùn)營的IP,成為社交內(nèi)容平臺的虛擬主播或偶像。

 

 

一個虛擬數(shù)字人是怎么誕生的?

 

從無到有創(chuàng)建一個虛擬的數(shù)字人不是一件容易的事。按照主要的流程,需要經(jīng)過建模、驅(qū)動、渲染三個關(guān)鍵步驟。

 

建模是虛擬數(shù)字人制作的第一步,目標(biāo)是制作出人物的形象。在建模的方式上,目前有手工建模、儀器采集建模和人工智能建模三種。

 

手工建模是目前應(yīng)用較廣的一種建模方式。一般來說,是通過電腦軟件畫出設(shè)計稿、描繪構(gòu)建出人物的視圖,然后根據(jù)設(shè)計圖紙確定人物三維的圖形。整體成本都比較高,一個超寫實虛擬人的模型可能需要上百萬元。

 

但是近年來,也出現(xiàn)了一些手工建模的工具應(yīng)用,極大的提高了生產(chǎn)效率。例如在2021年初,虛幻引擎開發(fā)商Epic Games推出了Metahuman Creator,用于快速創(chuàng)造出非常真實的虛擬數(shù)字人,任何人都可以在數(shù)分鐘內(nèi)完成創(chuàng)作。

 

這款工具提供給了用戶從發(fā)型、膚質(zhì)到體型等多種真人掃描的素材,用戶可自行組合素材以快速創(chuàng)建高保真虛擬人。而且渲染能力也十分厲害,可實現(xiàn)光源在不同膚色和紋理下的不同呈現(xiàn),從而達(dá)到極高的精細(xì)度。

 

圖 | Metahuman Creator

 

儀器采集建模的方式,通常用于真人1:1的還原,比如明星的真人還原或者是虛擬的分身等。相機(jī)陣列掃描重建的技術(shù)在專業(yè)級的影視及游戲中,應(yīng)用較為廣泛。這項技術(shù)通過瞬時獲取同一時刻同一對象的全方位照片信息,然后經(jīng)過后期的軟件計算、建模,最終得到對象的3D模型,能達(dá)到毫米級的重建精度。

 

圖|相機(jī)陣列掃描重建

 

人工智能建模是近年來隨著人工智能技術(shù)的發(fā)展出現(xiàn)的第三種建模的方式。主要的建模原理是:通過對大量的照片和視頻進(jìn)行分析,利用算法模擬出關(guān)鍵模型。這種建模的方式依賴于樣本的數(shù)量,針對單個人物樣本越多,則模型越精準(zhǔn)。但目前技術(shù)還不成熟,還遠(yuǎn)不能完全取代純?nèi)斯そEc借助采集設(shè)備進(jìn)行建模的結(jié)果。

 

建模之后,人物便有了基本的模樣。第二步,便是賦予這個靜態(tài)的模型,正常行動的能力,在虛擬數(shù)字人的技術(shù)上,我們稱之為「驅(qū)動」。

 

在目前的驅(qū)動方式上,主要分為兩種。一種是中之人驅(qū)動,另一種則是人工智能驅(qū)動。

 

所謂「中之人」,本來指的是特攝角色皮套里面的真人演員。到了近年,中之人通常指的是虛擬直播主背后的真人直播主。在目前的虛擬數(shù)字人的實際應(yīng)用中,仍然大部分以中之人來進(jìn)行驅(qū)動。

 

將中之人的動作與虛擬數(shù)字人產(chǎn)品一致性的聯(lián)動,需要通過設(shè)備,將中之人的動作、視覺、面部表情等進(jìn)行捕捉,將中之人的語音和其畫面進(jìn)行合成,是一套耗費(fèi)相當(dāng)大成本的操作。

 

而另一種人工智能的驅(qū)動方式,則是利用算法,輸入大量的圖像、文本、語音等原始數(shù)據(jù),通過深度學(xué)習(xí)的方式,生成相應(yīng)的內(nèi)容,再將音頻和影像進(jìn)行整體的輸出。其中涉及到的技術(shù)包括計算機(jī)視覺、語音識別、自然語言推理、自然語言理解、自然語義生成、語音合成等眾多技術(shù)。

 

在渲染的技術(shù)上,目前技術(shù)的成熟度較高,虛擬人的制作公司只需利用已有的渲染軟件進(jìn)行相應(yīng)畫面的處理和導(dǎo)出即可。在離線場景下,計算資源較為豐富,渲染的畫面質(zhì)量也會高。實時渲染的場景下,需要更多的硬件資源做支撐才能渲染出更高質(zhì)量的畫面。目前也有一些云端渲染的工具,雖然對硬件設(shè)備的要求較低,但是畫面的精度也相對較低。

 

 

虛擬與真實的交互共生

 

當(dāng)虛擬數(shù)字人被創(chuàng)造出來以后,更重要的是與現(xiàn)實世界的人產(chǎn)生交互,這樣才能在真實世界產(chǎn)生真實的應(yīng)用。目前虛擬數(shù)字人在真實世界中與用戶互動的方式,也主要分為:中之人直接進(jìn)行交互,人工智能進(jìn)行交互兩種方式。這兩種交互的方式也對應(yīng)著虛擬數(shù)字人在商業(yè)世界里不同的應(yīng)用場景。

 

以中之人驅(qū)動的虛擬數(shù)字人,其交互方式是通過其背后的真人來產(chǎn)生互動。我們在各個社交內(nèi)容平臺上看到的虛擬網(wǎng)紅主播們,大部分都是這樣的交互方式。

 

實際上,人們在追逐虛擬數(shù)字人的偶像時,更多地是關(guān)注與虛擬主播之間產(chǎn)生的互動與連接感,滿足內(nèi)心的情感需求。以中之人的形式直接與用戶產(chǎn)生互動時,在本質(zhì)上還是人與人之間的連結(jié)與互動,這樣的交互會非常人性而自然。

 

在目前的直播平臺上,以中之人驅(qū)動的虛擬數(shù)字人顯示出了強(qiáng)大的商業(yè)化能力。2022年5月,B站觀看量排行前20的直播中,虛擬主播占比達(dá)到30%。2021年,B站虛擬主播直播打賞營收整年保持了100%以上的同比增速,轉(zhuǎn)化率維持在20%左右?;⒀?、酷狗、愛奇藝等平臺都開設(shè)了虛擬主播相關(guān)的直播頻道。

 

從商業(yè)效率與穩(wěn)定性的角度看,中之人驅(qū)動與交互的方式也存在著不少弊端:生產(chǎn)效率低,一個中之人只能驅(qū)動一個虛擬人,難以實現(xiàn)量產(chǎn);而且中之人的角色至關(guān)重要,與虛擬數(shù)字人之間的關(guān)系需要處理得當(dāng),一個虛擬數(shù)字人的中之人演員的離開,可能會造成非常大的損失。

 

而人工智能與人直接交互的形式,受限于目前的人工智能的技術(shù),目前還僅僅停留在相對簡單的口令式階段中。在目前實際的應(yīng)用中,這類虛擬數(shù)字人常常作為服務(wù)型的角色,例如虛擬客服、虛擬導(dǎo)游、虛擬教師等。

 

但是隨著人工智能技術(shù)的進(jìn)一步發(fā)展與成熟,特別是AGI技術(shù)的演進(jìn),或許有一天,我們將會真的看到在《西部世界》《失控玩家》中出現(xiàn)的具有自我意識的虛擬人。在元宇宙虛實共生的圖景逐步完善后,虛擬數(shù)字人市場也將迎來以人機(jī)交互為主要發(fā)展方向的二次爆發(fā)。

 

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com