亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<dl id="bb16q"></dl>

<progress id="bb16q"></progress>

比真人還“搶鏡”，虛擬數(shù)字人會是流量明星的對手嗎？

商界觀察

2022-11-11

2012年7月12日，中國第一個虛擬偶像洛天依出道，她推出了《普通Disco》《東京不太熱》等知名歌曲，登上了北京冬奧的舞臺，在B站上擁有近300萬粉絲。

圖｜洛天依

在海外的Instagram平臺上，Lil Miquela是一位來自美國洛杉磯的19歲虛擬偶像博主，擁有298萬粉絲。她擁有巴西與西班牙的血統(tǒng)，標(biāo)志性的造型是齊劉海、雀斑和雙丸子頭，經(jīng)常與Gucci、Chanel等大牌合作。

圖｜Lil Miquela

實際上，在我國近年來發(fā)展迅速的視頻平臺上，涌現(xiàn)出了許多知名的虛擬數(shù)字人：會捉妖的美妝達(dá)人柳夜熙、虛擬偶像團(tuán)體A-Soul、清華的虛擬學(xué)生華智冰等等。

虛擬數(shù)字人的產(chǎn)業(yè)迅速發(fā)展起來。

美國著名的科幻作家尼爾·斯蒂芬森曾在其1992年出版的小說《雪崩》中，描繪了一個在現(xiàn)實世界之外的、由電腦和網(wǎng)絡(luò)構(gòu)成的賽博空間Metaverse，這也是如今爆火的「元宇宙」概念的起源。

對于一個Metaverse來說，所有現(xiàn)實世界的人在Metaverse中都有一個替身（Avatar），而虛擬數(shù)字人正是人類進(jìn)入這個未來的數(shù)字世界的入口。

本期《GGV投資筆記》，將與大家分享關(guān)于虛擬數(shù)字人的研究。

什么是虛擬數(shù)字人？

虛擬數(shù)字人是近年來出現(xiàn)的較為新穎的概念，因此沒有一個統(tǒng)一且確定的概念界定。

從最基本的詞義拆解來看，虛擬數(shù)字人包括「虛擬」和「數(shù)字」兩個基礎(chǔ)概念。所謂「虛擬」的人，強(qiáng)調(diào)人物身份虛構(gòu)、通過計算機(jī)圖形學(xué)技術(shù)進(jìn)行虛擬制作且具備人類的外觀和行為模式的人；而所謂「數(shù)字」的人，則是指存在于數(shù)字世界，身份設(shè)定和外觀可以按照現(xiàn)實世界中的人物進(jìn)行設(shè)定。

總結(jié)來看，根據(jù)中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟總體組和中關(guān)村數(shù)智人工智能產(chǎn)業(yè)聯(lián)盟數(shù)字人工作委員會發(fā)布的《2020 年虛擬數(shù)字人發(fā)展白皮書》中對虛擬數(shù)字人的描述是：

與具備實體的機(jī)器人不同，虛擬數(shù)字人依賴顯示設(shè)備存在。虛擬數(shù)字人宜具備以下三方面特征：

一是擁有人的外觀，具有特定的相貌、性別和性格等人物特征；
二是擁有人的行為，具有用語言、面部表情和肢體動作表達(dá)的能力；
三是擁有人的思想，具有識別外界環(huán)境、并能與人交流互動的能力。

實際上，從廣義上來看，虛擬數(shù)字人的發(fā)展歷史由來已久。

早在20世紀(jì)80年代，人們就開始嘗試將虛擬人物引入到現(xiàn)實世界，比如1982年，世界上第一位虛擬歌姬林明美出現(xiàn)了，雖然當(dāng)時技術(shù)是以傳統(tǒng)的手繪為主，但顯示出了虛擬人概念的萌芽。在21世紀(jì)初，計算機(jī)技術(shù)飛速發(fā)展，CG（計算機(jī)動畫）技術(shù)和動作捕捉技術(shù)發(fā)展日益成熟，日本制作了第一個被廣泛認(rèn)可的虛擬偶像初音未來，對虛擬數(shù)字人的探索越來越豐富。

近5年來，隨著深度學(xué)習(xí)的算法取得突破，虛擬數(shù)字人的制作過程也得到了有效地簡化。2019年，浦發(fā)銀行和百度共同合作開發(fā)的銀行業(yè)首位數(shù)字員工正式亮相；2018年，搜狗與新華社聯(lián)合發(fā)布全球首個全仿真智能AI主持人。

而如今，隨著虛擬數(shù)字人上下游的技術(shù)全面提升與突破，虛擬數(shù)字人也朝著全面的智能化、便捷化、精細(xì)化、多樣化發(fā)展。2020年，三星旗下STAR Labs展示了其設(shè)計的虛擬數(shù)字人NEON，顯示出了虛擬數(shù)字人在當(dāng)下的飛速成長。

遍覽市面上的虛擬數(shù)字人，我們可以從外觀、技術(shù)和具體應(yīng)用場景三個角度來進(jìn)行分類。

從外觀上來看，我們可以大致分為三類，以洛天依、A-SOUL為代表的卡通類；以Lil Miquela、湖南主持人小漾為代表的寫實類；以及以清華華智冰、騰訊Siren為代表的超寫實類。

圖 | 虛擬數(shù)字人外觀的分類

從虛擬人制作技術(shù)的角度看，也可以分為三種。第一種，是以形象和語音合成實現(xiàn)的非交互型的虛擬數(shù)字人，以洛天依為代表；第二種，是近年來涌現(xiàn)出的以真人驅(qū)動實現(xiàn)的虛擬數(shù)字人，即虛擬背后有一個真人貢獻(xiàn)了聲音、動作等，以A-soul為代表，他們可以和用戶產(chǎn)生一些互動，但是互動的來源是背后的真人；第三種，是隨著AI技術(shù)的發(fā)展，出現(xiàn)的以AI驅(qū)動、能與用戶產(chǎn)生AI的對話，甚至能自動生成唇形表情的虛擬數(shù)字人，目前在市場上的AI驅(qū)動型的知名虛擬數(shù)字人還相對較少。

從具體的應(yīng)用上來看，虛擬數(shù)字人可以分為服務(wù)型虛擬數(shù)字人與身份型虛擬數(shù)字人。服務(wù)型虛擬數(shù)字人長應(yīng)用于虛擬客服、虛擬導(dǎo)師，帶貨主播等場景；而身份型虛擬數(shù)字人，則被常常用以打造一些可供運(yùn)營的IP，成為社交內(nèi)容平臺的虛擬主播或偶像。

一個虛擬數(shù)字人是怎么誕生的？

從無到有創(chuàng)建一個虛擬的數(shù)字人不是一件容易的事。按照主要的流程，需要經(jīng)過建模、驅(qū)動、渲染三個關(guān)鍵步驟。

建模是虛擬數(shù)字人制作的第一步，目標(biāo)是制作出人物的形象。在建模的方式上，目前有手工建模、儀器采集建模和人工智能建模三種。

手工建模是目前應(yīng)用較廣的一種建模方式。一般來說，是通過電腦軟件畫出設(shè)計稿、描繪構(gòu)建出人物的視圖，然后根據(jù)設(shè)計圖紙確定人物三維的圖形。整體成本都比較高，一個超寫實虛擬人的模型可能需要上百萬元。

但是近年來，也出現(xiàn)了一些手工建模的工具應(yīng)用，極大的提高了生產(chǎn)效率。例如在2021年初，虛幻引擎開發(fā)商Epic Games推出了Metahuman Creator，用于快速創(chuàng)造出非常真實的虛擬數(shù)字人，任何人都可以在數(shù)分鐘內(nèi)完成創(chuàng)作。

這款工具提供給了用戶從發(fā)型、膚質(zhì)到體型等多種真人掃描的素材，用戶可自行組合素材以快速創(chuàng)建高保真虛擬人。而且渲染能力也十分厲害，可實現(xiàn)光源在不同膚色和紋理下的不同呈現(xiàn)，從而達(dá)到極高的精細(xì)度。

圖 | Metahuman Creator

儀器采集建模的方式，通常用于真人1:1的還原，比如明星的真人還原或者是虛擬的分身等。相機(jī)陣列掃描重建的技術(shù)在專業(yè)級的影視及游戲中，應(yīng)用較為廣泛。這項技術(shù)通過瞬時獲取同一時刻同一對象的全方位照片信息，然后經(jīng)過后期的軟件計算、建模，最終得到對象的3D模型，能達(dá)到毫米級的重建精度。

圖｜相機(jī)陣列掃描重建

人工智能建模是近年來隨著人工智能技術(shù)的發(fā)展出現(xiàn)的第三種建模的方式。主要的建模原理是：通過對大量的照片和視頻進(jìn)行分析，利用算法模擬出關(guān)鍵模型。這種建模的方式依賴于樣本的數(shù)量，針對單個人物樣本越多，則模型越精準(zhǔn)。但目前技術(shù)還不成熟，還遠(yuǎn)不能完全取代純?nèi)斯そＥc借助采集設(shè)備進(jìn)行建模的結(jié)果。

建模之后，人物便有了基本的模樣。第二步，便是賦予這個靜態(tài)的模型，正常行動的能力，在虛擬數(shù)字人的技術(shù)上，我們稱之為「驅(qū)動」。

在目前的驅(qū)動方式上，主要分為兩種。一種是中之人驅(qū)動，另一種則是人工智能驅(qū)動。

所謂「中之人」，本來指的是特攝角色皮套里面的真人演員。到了近年，中之人通常指的是虛擬直播主背后的真人直播主。在目前的虛擬數(shù)字人的實際應(yīng)用中，仍然大部分以中之人來進(jìn)行驅(qū)動。

將中之人的動作與虛擬數(shù)字人產(chǎn)品一致性的聯(lián)動，需要通過設(shè)備，將中之人的動作、視覺、面部表情等進(jìn)行捕捉，將中之人的語音和其畫面進(jìn)行合成，是一套耗費(fèi)相當(dāng)大成本的操作。

而另一種人工智能的驅(qū)動方式，則是利用算法，輸入大量的圖像、文本、語音等原始數(shù)據(jù)，通過深度學(xué)習(xí)的方式，生成相應(yīng)的內(nèi)容，再將音頻和影像進(jìn)行整體的輸出。其中涉及到的技術(shù)包括計算機(jī)視覺、語音識別、自然語言推理、自然語言理解、自然語義生成、語音合成等眾多技術(shù)。

在渲染的技術(shù)上，目前技術(shù)的成熟度較高，虛擬人的制作公司只需利用已有的渲染軟件進(jìn)行相應(yīng)畫面的處理和導(dǎo)出即可。在離線場景下，計算資源較為豐富，渲染的畫面質(zhì)量也會高。實時渲染的場景下，需要更多的硬件資源做支撐才能渲染出更高質(zhì)量的畫面。目前也有一些云端渲染的工具，雖然對硬件設(shè)備的要求較低，但是畫面的精度也相對較低。

虛擬與真實的交互共生

當(dāng)虛擬數(shù)字人被創(chuàng)造出來以后，更重要的是與現(xiàn)實世界的人產(chǎn)生交互，這樣才能在真實世界產(chǎn)生真實的應(yīng)用。目前虛擬數(shù)字人在真實世界中與用戶互動的方式，也主要分為：中之人直接進(jìn)行交互，人工智能進(jìn)行交互兩種方式。這兩種交互的方式也對應(yīng)著虛擬數(shù)字人在商業(yè)世界里不同的應(yīng)用場景。

以中之人驅(qū)動的虛擬數(shù)字人，其交互方式是通過其背后的真人來產(chǎn)生互動。我們在各個社交內(nèi)容平臺上看到的虛擬網(wǎng)紅主播們，大部分都是這樣的交互方式。

實際上，人們在追逐虛擬數(shù)字人的偶像時，更多地是關(guān)注與虛擬主播之間產(chǎn)生的互動與連接感，滿足內(nèi)心的情感需求。以中之人的形式直接與用戶產(chǎn)生互動時，在本質(zhì)上還是人與人之間的連結(jié)與互動，這樣的交互會非常人性而自然。

在目前的直播平臺上，以中之人驅(qū)動的虛擬數(shù)字人顯示出了強(qiáng)大的商業(yè)化能力。2022年5月，B站觀看量排行前20的直播中，虛擬主播占比達(dá)到30%。2021年，B站虛擬主播直播打賞營收整年保持了100%以上的同比增速，轉(zhuǎn)化率維持在20%左右?；⒀?、酷狗、愛奇藝等平臺都開設(shè)了虛擬主播相關(guān)的直播頻道。

從商業(yè)效率與穩(wěn)定性的角度看，中之人驅(qū)動與交互的方式也存在著不少弊端：生產(chǎn)效率低，一個中之人只能驅(qū)動一個虛擬人，難以實現(xiàn)量產(chǎn)；而且中之人的角色至關(guān)重要，與虛擬數(shù)字人之間的關(guān)系需要處理得當(dāng)，一個虛擬數(shù)字人的中之人演員的離開，可能會造成非常大的損失。

而人工智能與人直接交互的形式，受限于目前的人工智能的技術(shù)，目前還僅僅停留在相對簡單的口令式階段中。在目前實際的應(yīng)用中，這類虛擬數(shù)字人常常作為服務(wù)型的角色，例如虛擬客服、虛擬導(dǎo)游、虛擬教師等。

但是隨著人工智能技術(shù)的進(jìn)一步發(fā)展與成熟，特別是AGI技術(shù)的演進(jìn)，或許有一天，我們將會真的看到在《西部世界》《失控玩家》中出現(xiàn)的具有自我意識的虛擬人。在元宇宙虛實共生的圖景逐步完善后，虛擬數(shù)字人市場也將迎來以人機(jī)交互為主要發(fā)展方向的二次爆發(fā)。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

三個臭皮匠如何才能頂個諸葛亮？

人形機(jī)器人為什么還是要看中國

經(jīng)濟(jì)復(fù)蘇重回全國第一，上?；匮饕窟@幾個產(chǎn)業(yè)？

富士康的“高科技”你不懂

商用服務(wù)機(jī)器人潮起又潮落