亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

百度使用AI數(shù)字人創(chuàng)建GMV

06-19 11:09
羅永浩又被殺了。

六月十五日晚,羅永浩數(shù)字人在百度電商完成了第一場直播,吸引了超過1300人觀看。在這些人中,GMV(商品交易總額)突破5500萬元,部分3C、超羅永浩5月份的真人首秀數(shù)據(jù),如食品等關(guān)鍵品類商品帶貨單量,創(chuàng)造了數(shù)字人直播銷售新紀(jì)錄。


當(dāng)大部分AI公司還處于多模式的階段,搶用戶的時(shí)候,百度已經(jīng)基于更先進(jìn)、更有感染力的數(shù)字人技術(shù),為行業(yè)支付了滿分答卷——用AI創(chuàng)造GMV。



但是,這樣一個(gè)有實(shí)力帶貨的數(shù)字人是怎么做出來的呢?高感染力的數(shù)字人是怎么做到的?百度最近正式向我們透露了這個(gè)秘密。


百度已經(jīng)用AI創(chuàng)造了GMV。


毫無疑問,2025年是智能體的第一年。除了之前流行的通用智能體,越來越多專注于辦公、設(shè)計(jì)等場景的垂直智能體也相繼出現(xiàn),占據(jù)了人們的視野。


從業(yè)內(nèi)人士的角度來看,百度的高感染力數(shù)字人本質(zhì)上是一種超級智能體,其可用性可以從這次直播的結(jié)果中看出。


36Kr了解到,作為第一位數(shù)字主播和百度電商的合作,“數(shù)字人羅永浩”的背后是百度匯播明星的數(shù)字直播技術(shù)。這項(xiàng)高感染力的數(shù)字技術(shù)于今年4月推出。它的特點(diǎn)是可以像真人一樣高度協(xié)調(diào),思考決策,合作完成特定的任務(wù),本質(zhì)上是一個(gè)超級智能的身體。


百度副總裁、百度電商總經(jīng)理平曉黎也表示,“百度的羅永浩數(shù)字人已經(jīng)達(dá)到了堪比超級主播的體驗(yàn)效果。隨著大模型和多模型能力的發(fā)展,數(shù)字人在未來有很大的潛力超越真人”。



據(jù)百度介紹,羅永浩數(shù)字人是惠播星的新一代高感染力數(shù)字人。通過羅永浩海量的數(shù)據(jù)訓(xùn)練,完成了劇本、動(dòng)作、聲音、劇本、問答、互動(dòng)等維度的全面升級。通過雙數(shù)字人的默契互動(dòng)、數(shù)字人玩梗、更高頻率的互動(dòng)問答等。,提高了客戶的沉浸感,完成了感受、內(nèi)容、視覺、效果的四大突破。



平曉黎分享了她看到的很多用戶的評論。聽到最多的聲音是大家都覺得很逼真,很多客戶在直播中問老羅是不是AI。平曉黎認(rèn)為,隨著像羅永浩這樣標(biāo)桿IP數(shù)字人的積極反饋,用戶對數(shù)字人的接受和認(rèn)可得到了更大程度的體現(xiàn)。廣播明星數(shù)字人不僅是降低商家成本的AI工具,也給客戶帶來了全新的感受。這是一個(gè)人貨匹配的新詮釋?!斑@是一個(gè)新的里程碑,意味著智能電子商務(wù)進(jìn)入了一個(gè)新的篇章?!?/p>


難怪老羅也通過微博和視頻表達(dá)了“完美結(jié)局”和“讓我驚訝”和“我真的很佩服”的一鍵三連認(rèn)可。當(dāng)被問及他對數(shù)字人的感受時(shí),作為惠播星的首席體驗(yàn)官,羅永浩表示超出預(yù)期:“數(shù)字人直播可能代表了電子商務(wù)直播的新趨勢?!?/p>


毫無疑問,這是一場“展示肌肉”的特別直播,其結(jié)果直接超過了羅永浩5月份帶貨的GMV。與上一次相比,這次直播更受關(guān)注,直接引起了外界對其技術(shù)實(shí)質(zhì)的好奇。


百度慧播星打造的數(shù)字人作為超級智能體,體現(xiàn)了極其全面的能力,不僅能讓你擁有一個(gè)神形音容高度一致的數(shù)字人主播,還能通過多智能體調(diào)度實(shí)現(xiàn)AI大腦的轉(zhuǎn)化和提升,讓一個(gè)人看起來像一個(gè)直播團(tuán)隊(duì)。據(jù)報(bào)道,使用慧播星,直播平均轉(zhuǎn)化率提高了31%,而播出成本降低了80%。這些都離不開慧播星的百度全棧自研能力,從而達(dá)到最佳的體驗(yàn)。


百度集團(tuán)副總裁吳甜也在開放日現(xiàn)場表示,“從結(jié)構(gòu)上看,百度的AI技術(shù)一直是全棧建設(shè)的,從模式上看,一直是全模式發(fā)展的。語言、語音、視覺技術(shù)經(jīng)過多年的發(fā)展和積累。現(xiàn)在是從單模態(tài)到多模態(tài)融合的非常好的時(shí)間點(diǎn)。”


隨著長期的技術(shù)積累,百度迎來了更早的變革時(shí)刻。羅永浩數(shù)字人在百度電商的直播成績?yōu)橹悄荏w撕裂了一個(gè)缺口。未來,成本可以通過大規(guī)??刂频阶畹停苯咏鉀Q了智能體賽道的兩大問題。


在行業(yè)還處于多模態(tài)路線之爭的時(shí)候,百度已經(jīng)在用AI創(chuàng)造GMV了。


直球打在數(shù)字人身上


正如李彥宏所說,數(shù)字人是百度大模型多模式的綜合體現(xiàn)。與通用視頻生成模型相比,數(shù)字人專注于特定的垂直領(lǐng)域,具有優(yōu)化模型、追求終極人機(jī)交互體驗(yàn)、實(shí)時(shí)交互能力、技術(shù)門檻相對較低、應(yīng)用領(lǐng)域清晰、更容易形成可復(fù)制商業(yè)模式等優(yōu)點(diǎn)。羅永浩數(shù)字人長期直播是百度大模型多模型能力的最佳體現(xiàn)。


據(jù)報(bào)道,全場直播AI調(diào)用知識庫13000次,生成97000字產(chǎn)品講解內(nèi)容,雙數(shù)字合作伙伴做出8300多個(gè)動(dòng)作。


這次在交流會(huì)上,百度集團(tuán)副總裁吳甜還特別向我們講解了數(shù)字人背后的技術(shù)邏輯。



百度開發(fā)的多模協(xié)同數(shù)字人員技術(shù)規(guī)范重點(diǎn)包括劇本驅(qū)動(dòng)的數(shù)字人員多模協(xié)同、結(jié)合多模規(guī)劃和深度思考的劇本生成、動(dòng)態(tài)決策的實(shí)時(shí)互動(dòng)、文本自控的語音合成、高度一致性超擬真實(shí)數(shù)字人員長視頻生成五項(xiàng)創(chuàng)新技術(shù),完成了數(shù)字人員“神、形、音、容、話”的高度統(tǒng)一。最終呈現(xiàn)出一位超擬真數(shù)字人,具有高感染力,內(nèi)容吸引人,人-物-場可以自由交互。


首先,語言模型是其核心驅(qū)動(dòng)力。語言模型負(fù)責(zé)生成“劇本”,然后通過劇本引導(dǎo)語音和視覺進(jìn)行多模式的系統(tǒng)和動(dòng)態(tài)交互。



因此,劇本的質(zhì)量對于數(shù)字人的表現(xiàn)尤為重要。要知道,數(shù)字人在直播過程中,最重要的是口語臺詞,這些臺詞會(huì)因?yàn)椴煌瑪?shù)字人的多樣化風(fēng)格、擬真化人的設(shè)計(jì)和吸引人的內(nèi)容而表現(xiàn)出各種各樣的結(jié)果。


這也是高質(zhì)量、擬人化的劇本生成技術(shù)的加持,可以讓數(shù)字人擁有鮮明的個(gè)性、個(gè)性和有趣的語言特征,就像真正的主播一樣。這些都是對語言模型能力的考驗(yàn)。


在劇本生成過程中,會(huì)帶出視覺標(biāo)簽和語音標(biāo)簽,引導(dǎo)語音模型調(diào)整語氣,視覺模型對齊唇部運(yùn)動(dòng)和表情生成,讓數(shù)字人看起來更加自然流暢。此外,數(shù)字人可以根據(jù)直播間的人氣和用戶的反饋,與用戶進(jìn)行即時(shí)動(dòng)態(tài)的智能交互。


一位擁有高質(zhì)量感覺的數(shù)字人直播,在劇本之后,關(guān)鍵環(huán)節(jié)還包括語音合成和視頻生成。


在語音合成方面,通過文本自控的語音合成大模型,可以實(shí)現(xiàn)高復(fù)原的語音合成能力,結(jié)合直播臺詞和發(fā)音人的特點(diǎn),產(chǎn)生風(fēng)格合適、自然流暢的聲音。為了解決羅永浩數(shù)字人現(xiàn)場配合聲音的難題,他們選擇了對話前后的編碼器,統(tǒng)一計(jì)算了對話的歷史輸入和當(dāng)前對話的語音合成,向我們展示了老羅和朱蕭木數(shù)字人在現(xiàn)場直播中的自然對話效果。


與今天市場上常見的10S相比,、在20S形成視頻時(shí),數(shù)字人的直播工作通常是小時(shí)級的,百度因此構(gòu)建了一套完整的數(shù)字人形象生成和驅(qū)動(dòng)技術(shù)。


該技術(shù)是一項(xiàng)可控的、長視頻的形成工作。通過結(jié)合多模態(tài)視頻理解、跨模態(tài)信號生成、視頻生成等技術(shù),結(jié)合視頻、劇本、語言、骨骼等特點(diǎn),形成高度一致的數(shù)字人長視頻。


不要卷超級應(yīng)用,做很有用。


今年4月,百度高感染力數(shù)字技術(shù)發(fā)布時(shí),李彥宏在現(xiàn)場表達(dá)了自己的感受?!?025年最激動(dòng)人心的突破應(yīng)用之一是AI數(shù)字人?!碑?dāng)時(shí)李彥宏介紹,百度發(fā)布的高感染力數(shù)字人具有聲形超擬真、內(nèi)容更專業(yè)、互動(dòng)更靈活的特點(diǎn),在電商直播、游戲、消費(fèi)等領(lǐng)域有著巨大的應(yīng)用空間。"


事實(shí)上,百度在投注大模型業(yè)務(wù)之初就提出了一個(gè)特殊的觀點(diǎn)——百度不是推出“超級應(yīng)用”,而是幫助更多的人和企業(yè)打造數(shù)百萬“非常有用”的應(yīng)用。數(shù)字人是當(dāng)前電子商務(wù)行業(yè)“非常有用”的應(yīng)用。


事實(shí)上,在羅永浩數(shù)字人在百度上線之前,業(yè)界一直在討論羅永浩是否會(huì)再次高調(diào)下山,進(jìn)入百度,在其他平臺上復(fù)制自己的超高成績。


結(jié)果卻大大超出了行業(yè)的預(yù)期,更重要的是,盡管是數(shù)字人,但其用戶轉(zhuǎn)換效果卻堪比真人。


有用戶在直播間問“蘇超”最近的熱點(diǎn)事件,數(shù)字人羅永浩會(huì)回應(yīng):“我知道蘇超最近很受歡迎。比賽第一友情第十四,熱梗很多。我建議國足也和蘇超一起學(xué)習(xí)?!备杏X很流暢。


根據(jù)披露,本次直播擁有超過1300萬用戶觀看,用戶互動(dòng)3倍,用戶觀看時(shí)間超過30%。、與真人直播相比,訂單量高出150%。、訂購用戶比真人主播多230%。這一數(shù)字也意味著,用戶對數(shù)字人的接受程度得到了驗(yàn)證。


百度電商業(yè)務(wù)部負(fù)責(zé)人、數(shù)字人創(chuàng)新業(yè)務(wù)部負(fù)責(zé)人吳晨霞也特別揭示了羅永浩數(shù)字人成功的真相——百度通過羅永浩和朱蕭木的海量數(shù)據(jù)訓(xùn)練生成了數(shù)字人主播,并根據(jù)產(chǎn)品特點(diǎn)和羅永浩人定制了量身定制的直播劇本,完成了羅永浩和朱蕭木的慣性動(dòng)作和表情的高度統(tǒng)一,讓他們像真人一樣自然。


吳晨霞向我們解釋說:“在很多場景下,我們擔(dān)心數(shù)字人會(huì)更多地講述整個(gè)劇本,但我們不能讓用戶繼續(xù)觀看。這次直播確認(rèn)了。



一位羅永浩還是這樣,更多的主播可能會(huì)有機(jī)會(huì)感受到技術(shù)普惠趨勢帶來的效率和便利。


要知道,過去因?yàn)榧夹g(shù)不成熟,數(shù)字人效果差,普通消費(fèi)者體驗(yàn)一言難盡。很多平臺禁止數(shù)字主播直播賣貨。


然而,百度電子商務(wù)通過成熟的技術(shù)結(jié)構(gòu)開辟了新的市場。它不僅解決了多模式商業(yè)化的問題,也為直播電子商務(wù)行業(yè)找到了更科學(xué)、更有前景的技術(shù)方向。在多個(gè)電子商務(wù)平臺上,數(shù)字直播正從一個(gè)可選項(xiàng)轉(zhuǎn)變?yōu)橐粋€(gè)必要的選項(xiàng)。


在這次交流會(huì)上,百度電子商務(wù)推出了兩個(gè)主要計(jì)劃:夢蝶計(jì)劃將通過流量支持、超級主播數(shù)字化建設(shè)、預(yù)算支持等方式,實(shí)現(xiàn)百度超級主播數(shù)量的倍增;明星計(jì)劃將再次增加10萬只智能明星數(shù)字人,投資1億元數(shù)字人消費(fèi)補(bǔ)貼和1000萬級運(yùn)營援助,幫助更多普通人和中小企業(yè)開啟數(shù)字人直播。


這可能只是一個(gè)新的開始。根據(jù)平曉黎的分享,百度將數(shù)字人分為四個(gè)階段?!霸?.0階段,虛擬人的外表只是簡單的完成,但動(dòng)作僵硬,機(jī)械聲音沉重。2.0是一個(gè)超擬真數(shù)字人,完成了對人物形象的高精度復(fù)制和大動(dòng)作的支持,擺脫了紙人的效果,可以生成口頭劇本與觀眾互動(dòng)。目前主流數(shù)字人處于這個(gè)階段。高感染力的百度數(shù)字人將AI數(shù)字人帶入3.0階段。



但事實(shí)上,百度的終極理想不是3.0,而是一個(gè)真正超越真人的數(shù)字4.0時(shí)代?!皵?shù)字人有機(jī)會(huì)登上主流舞臺,在很多方面都可以超越真人。比如長時(shí)間待機(jī),定向推廣,可以讓同一個(gè)人用不同的語言,用不同的風(fēng)格直播。數(shù)字人的天花板還是很高的,超越真人效果的機(jī)會(huì)很大。沒有數(shù)字人會(huì)取代真人。因?yàn)閿?shù)字人的最終目的是為人服務(wù),所以人類總是決定技術(shù)的方向?!?/p>


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com