從百萬定制到百元白菜價(jià),數(shù)字人進(jìn)入“平民化時(shí)代”?
克隆一個(gè)“數(shù)字分身”,已經(jīng)從科幻走向日常,且門檻越來越低。
只需提供一段本人視頻,AI技術(shù)便能精準(zhǔn)采集樣貌、聲音、動(dòng)作、表情等核心特征,1:1復(fù)刻出與真人高度相似的數(shù)字人。這些“數(shù)字分身”已能承擔(dān)多重角色,既能代替真人主播在直播間帶貨引流,也能化身客服實(shí)時(shí)響應(yīng)咨詢,成為覆蓋多場景的實(shí)用工具。
回溯數(shù)字人發(fā)展,2019年,數(shù)字人“晚玉”率先登上直播舞臺(tái),拉開行業(yè)商業(yè)化序幕;此后,柳夜熙、希加加、度曉曉、翎_LING等各具風(fēng)格的虛擬數(shù)字人相繼涌現(xiàn),逐步豐富了生態(tài)。
如今六年過去,在大模型與AI技術(shù)的持續(xù)迭代賦能下,虛擬數(shù)字人的技術(shù)成熟度大幅提升,應(yīng)用場景也突破了早期的娛樂展示邊界,深度滲透至電商、客服等多個(gè)行業(yè),成為企業(yè)降本增效的關(guān)鍵抓手。
在美團(tuán)、京東等主流平臺(tái)的直播間,數(shù)字人主播早已不是新鮮面孔,他們像真人主播般熟練介紹產(chǎn)品亮點(diǎn)、拆解優(yōu)惠機(jī)制,甚至能“人味兒”十足地實(shí)時(shí)回答消費(fèi)者的各類疑問,互動(dòng)流暢度與真實(shí)感絲毫不遜于真人直播。
在剛剛過去的“雙11”,百度稱,83%的商家在本次雙11活動(dòng)中使用過數(shù)字人進(jìn)行開播。京東探索研究院數(shù)據(jù)顯示,數(shù)字人直播服務(wù)超4萬家品牌商。
隨著應(yīng)用滲透率的持續(xù)攀升,數(shù)字人賽道的商業(yè)價(jià)值愈發(fā)凸顯,資本與企業(yè)的入局節(jié)奏同步加快,行業(yè)新一輪的激烈角逐已拉開序幕。
從數(shù)百萬到百元,人人都能擁有一個(gè)數(shù)字人
一位女裝店老板告訴Tech星球,自己既要對(duì)接面料供應(yīng)商、跟進(jìn)打版細(xì)節(jié),又要全程盯緊工廠生產(chǎn)進(jìn)度,日常精力嚴(yán)重透支。對(duì)她而言,引入數(shù)字人直播是她緩解銷售壓力的期待,目前已產(chǎn)生明確的嘗試意向。
另一位餐飲店店主也表達(dá)了相似訴求,“看到美團(tuán)、京東等平臺(tái)上,很多同行靠數(shù)字人直播帶貨收效明顯,節(jié)省了不少人工成本,還能實(shí)現(xiàn)全天不間斷開播,我的確也有嘗試的想法?!?/p>
即便生意規(guī)模有限,這些中小企業(yè)主對(duì)新技術(shù)的接納意愿并未打折。
一位數(shù)字人服務(wù)商告訴Tech星球,自己日均能接到10余條咨詢,咨詢者多為服裝店、餐飲店等中小企業(yè)主,且大多帶著直播帶貨、全天開播、降本增效等明確業(yè)務(wù)場景訴求。
靈犀深智聯(lián)合創(chuàng)始人賈春鑫則更精準(zhǔn)地指出:“現(xiàn)在的數(shù)字人直播對(duì)于企業(yè)而言,已經(jīng)不再是一個(gè)工具,而是一個(gè)數(shù)字員工?!?/p>
中小企業(yè)主的嘗試意愿高漲,核心在于擁有一名數(shù)字人員工的門檻正大幅降低。從過去動(dòng)輒數(shù)百萬元的定制成本,快速下探至千元甚至百元級(jí)的價(jià)位。
早年間,數(shù)字人曾是大企業(yè)專屬的“高奢”配置。百度智能云AI及應(yīng)用產(chǎn)品中心副總經(jīng)理劉倩曾公開披露,百度布局?jǐn)?shù)字人之初,第一代產(chǎn)品的單個(gè)制作成本高達(dá)500萬至600萬元。
而如今,隨著技術(shù)迭代與行業(yè)競爭加劇,數(shù)字人價(jià)格已進(jìn)入“平民化時(shí)代”。上述服務(wù)商直言,當(dāng)前單個(gè)數(shù)字人制作成本已下探至數(shù)百元到數(shù)萬元不等,千元和萬元級(jí)的產(chǎn)品早已成為主流。
硅基智能招股書也印證了這一趨勢,數(shù)據(jù)顯示,其標(biāo)準(zhǔn)產(chǎn)品定價(jià)通常介于5500元至25000元之間,進(jìn)一步覆蓋了中小商家的預(yù)算范圍。
價(jià)格之外,靈活的合作模式也降低了中小企業(yè)主們嘗試的門檻。Tech星球通過多家數(shù)字人企業(yè)了解到,目前市面上的服務(wù)模式已形成多元選擇:既有定制服務(wù)、付費(fèi)訂閱,也有平臺(tái)代運(yùn)營等形式。
對(duì)于中小商家而言,無需一次性投入高額成本,可根據(jù)自身直播帶貨、日常運(yùn)營等實(shí)際需求,結(jié)合預(yù)算自主選擇高性價(jià)比方案。
而針對(duì)大型企業(yè)更復(fù)雜的業(yè)務(wù)場景與深度合作需求,廠商也提供定制化解決方案,定價(jià)可達(dá)百萬級(jí),形成覆蓋從中小用戶到大型企業(yè)的全場景定價(jià)體系。
玩家涌入,數(shù)字人同質(zhì)化競爭
近期,因百度世界2025大會(huì)上羅永浩數(shù)字人的亮相,數(shù)字人賽道再度掀起熱潮。
百度在現(xiàn)場設(shè)置了特色互動(dòng)展區(qū),觀眾可與現(xiàn)場的羅永浩數(shù)字人實(shí)時(shí)連麥。據(jù)到場博主發(fā)布的視頻顯示,該數(shù)字人不僅能對(duì)各類問題快速響應(yīng)并精準(zhǔn)作答,其動(dòng)作、表情、神態(tài)更與羅永浩本人高度復(fù)刻,甚至能精準(zhǔn)識(shí)別博主的衣著搭配,就像隔著屏幕和老羅視頻通話。
回溯早期發(fā)展階段,數(shù)字人在智能交互、動(dòng)作精準(zhǔn)度、形象擬真性等方面存在明顯短板?!爱?dāng)時(shí)的數(shù)字人更像程序化的機(jī)器人,多采用錄播式播報(bào),與消費(fèi)者的實(shí)時(shí)互動(dòng)體驗(yàn)較差”,一位數(shù)字人行業(yè)銷售向Tech星球透露。
但他表示,如今的數(shù)字人直播早已脫離“對(duì)口型 + 錄播”的初級(jí)階段,實(shí)時(shí)互動(dòng)、動(dòng)態(tài)回應(yīng)等功能已相當(dāng)完善,完全能滿足中小商家的直播需求。
賈春鑫向Tech星球進(jìn)一步解釋:傳統(tǒng)數(shù)字人的核心就是唇動(dòng)技術(shù),一段語音進(jìn)來后驅(qū)動(dòng)嘴型同步,面部以外的肢體動(dòng)作等都是提前錄制好的內(nèi)容,相當(dāng)于 “提線木偶”。
而近幾年大模型技術(shù)的發(fā)展,為數(shù)字人技術(shù)注入了兩大關(guān)鍵能力。首先,是讓數(shù)字人有了 “靈魂”,能夠自主與外界進(jìn)行聲音和語言維度的交互;其次,是肢體語言的動(dòng)態(tài)生成,完全可以根據(jù)對(duì)話內(nèi)容,同步生成匹配的表情、肢體動(dòng)作,甚至實(shí)現(xiàn)與外界場景的互動(dòng)。
“正是這兩大能力,讓數(shù)字人成為真正意義上的‘人’,應(yīng)用場景將會(huì)變得非常廣泛,也將成為主流的交互體驗(yàn)形式”,賈春鑫補(bǔ)充道。
技術(shù)破壁的背后,是多元玩家的集結(jié),他們共同推動(dòng)了技術(shù)的成熟,以及成本的下降。
當(dāng)前賽道已形成三類核心玩家梯隊(duì):以百度、騰訊、阿里、網(wǎng)易、科大訊飛為代表的科技巨頭,和商湯科技、小冰公司等人工智能服務(wù)商,以及靈犀深智、硅基智能、Tiamat等聚焦垂直領(lǐng)域與特定應(yīng)用場景的企業(yè)。
不過賽道火熱的同時(shí),大量玩家的涌入也帶來了新的行業(yè)痛點(diǎn):技術(shù)門檻被快速拉低,產(chǎn)品同質(zhì)化現(xiàn)象愈發(fā)突出。
作為2024年中國數(shù)字人市場占有率最高的企業(yè),硅基智能的招股書數(shù)據(jù)便直觀暴露了行業(yè)共性挑戰(zhàn)。
招股書數(shù)據(jù)顯示,其毛利率呈波動(dòng)下滑態(tài)勢,在2023年達(dá)到45.8%的峰值后,2024年降至34.3%,2025年上半年進(jìn)一步滑落至31.6%。
客戶結(jié)構(gòu)同樣不容樂觀,報(bào)告期內(nèi)客戶總數(shù)從573家縮減至289家,而最大客戶收入占比卻從2022年的16.6%飆升至2025年上半年的64.4%,大客戶依賴度急劇攀升,抗風(fēng)險(xiǎn)能力顯著減弱。
數(shù)字人如何做到“更像人”?
“只要不是用直播的形式播放數(shù)字人的錄播,平臺(tái)一定不會(huì)封直播間”,上述一位數(shù)字人服務(wù)商銷售稱。
但事實(shí)上,目前各大電商平臺(tái)對(duì)于數(shù)字人直播的規(guī)則不一,且均已出臺(tái)相應(yīng)規(guī)范措施。
抖音規(guī)定,使用虛擬人直播需先在平臺(tái)注冊虛擬人形象,直播時(shí)須由真人驅(qū)動(dòng)實(shí)現(xiàn)實(shí)時(shí)互動(dòng),禁止純AI驅(qū)動(dòng)互動(dòng),且虛擬人直播必須進(jìn)行顯著標(biāo)識(shí)??焓忠笊碳沂褂脭?shù)字人直播時(shí),僅可采用平臺(tái)提供的數(shù)字人能力,且直播內(nèi)容不得在短時(shí)間內(nèi)高度機(jī)械重復(fù)。
騰訊視頻號(hào)則更嚴(yán)格,其在《視頻號(hào)櫥窗達(dá)人【發(fā)布低質(zhì)量內(nèi)容】實(shí)施細(xì)則》中,明確禁止使用虛擬數(shù)字人等非真人形式進(jìn)行代播。
平臺(tái)規(guī)則的嚴(yán)格性,在實(shí)操中體現(xiàn)得尤為明顯,一位數(shù)字人供應(yīng)方告訴Tech星球,在抖音開展純數(shù)字人直播極易被封號(hào)、限流。
為避免封號(hào),就得打造一眼真的直播間,比如通過提示用戶加燈牌等方式模擬真人互動(dòng)。
今年上半年的諸多案例,更印證了合規(guī)風(fēng)險(xiǎn)的真實(shí)存在。不少商家公開稱,自己花費(fèi)數(shù)萬元購買的數(shù)字人產(chǎn)品,開播不到一個(gè)月就因“直播違規(guī)”被平臺(tái)多次封禁,前期投入近乎打水漂。
除了合規(guī)難題,數(shù)字人現(xiàn)存的體驗(yàn)短板也不容忽視。
一位嘗試過數(shù)字人直播的餐飲商家向Tech星球反饋,“如果只是隨手刷直播間,不仔細(xì)分辨,的確不能很快察覺出這是數(shù)字人在直播,但如果你仔細(xì)去辨別,數(shù)字人與真人主播之間的區(qū)別便會(huì)顯現(xiàn)?!?/p>
賈春鑫也表示,靈犀深智旗下的秒播AI數(shù)字人直播,大概相當(dāng)于專業(yè)真人主播8成的功力,已經(jīng)超過了普通的素人主播,但還需要繼續(xù)進(jìn)化。
關(guān)鍵還是體驗(yàn)突破,提升AI的直播能力。所以現(xiàn)階段也決定了數(shù)字人的核心定位,并非直接替代專業(yè)主播,而是以提效降本為主要價(jià)值。
正如賈春鑫所言,“數(shù)字人直播的首要作用是提效,當(dāng)真人直播難以實(shí)現(xiàn)預(yù)期投資回報(bào)率,或受限于時(shí)長無法全天開播時(shí),AI數(shù)字人可以作為有效補(bǔ)充,填補(bǔ)直播時(shí)段空白、降低運(yùn)營成本,獲得額外的增量收益。”
不過,百度通過羅永浩數(shù)字人的公開亮相,或許將會(huì)是數(shù)字人賽道的下一步發(fā)展方向。讓數(shù)字人具備更高階的智能交互能力、更貼近真人的表達(dá)與反應(yīng)邏輯,或?qū)⒊蔀閿?shù)字人賽道突破當(dāng)前瓶頸,實(shí)現(xiàn)下一階段跨越的關(guān)鍵節(jié)點(diǎn)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






