亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

騰訊混元3D Lite版登場(chǎng),3D模型全民化曙光初現(xiàn)?

08-21 07:06
每個(gè)人都有望擁有創(chuàng)造虛構(gòu)3D世界的能力。

8月15日,騰訊混元團(tuán)隊(duì)推出了3D世界模型的Lite版本。以往該模型需要26GB的顯存,而此次引入動(dòng)態(tài)FP8(8位浮點(diǎn)格式)量化技術(shù)后,顯存需求直接降至17GB以下,消費(fèi)級(jí)顯卡也能流暢運(yùn)行。

此前,騰訊混元3D世界模型的FP32版本雖能保留所有細(xì)節(jié),但顯存占用極高。其參數(shù)可能超十億個(gè),通常需大容量VRAM的GPU提升推理速度,消費(fèi)級(jí)顯卡無法支持。

簡(jiǎn)單來講,F(xiàn)P32、FP16、FP8代表不同的「精度等級(jí)」。過去用高精度的FP32技術(shù),雖精度還原高,但占用大量顯存,還可能保留不必要細(xì)節(jié),像背景的天空貼圖等無需精雕細(xì)琢。

此次動(dòng)態(tài)FP8量化技術(shù)的核心是能實(shí)時(shí)監(jiān)測(cè)模型運(yùn)行時(shí)的數(shù)據(jù)分布,并針對(duì)不同模塊動(dòng)態(tài)適配:大部分關(guān)鍵區(qū)域采用FP16精度,非關(guān)鍵部分如背景貼圖等動(dòng)態(tài)調(diào)整為FP8精度。

這一技術(shù)大幅降低了顯存占用,雖在部分區(qū)域降低了精度,但讓個(gè)人玩家也能輕松使用3D世界模型。

騰訊混元3D革新3D建模流程

騰訊混元3D世界模型是行業(yè)內(nèi)首個(gè)開源可編輯的世界生成模型,能根據(jù)用戶提供的圖片或文字信息,直接生成完整、可編輯且可交互的世界模型,可應(yīng)用于游戲開發(fā)、特效制作、教育仿真等場(chǎng)景。

與騰訊混元模型此前的3D模型AI生成功能相比,此次推出的3D世界模型生成的內(nèi)容更豐富,涵蓋環(huán)境風(fēng)格、室內(nèi)外場(chǎng)景、光線渲染等多個(gè)因素。傳統(tǒng)3D場(chǎng)景開發(fā)耗時(shí)久,一個(gè)主要建筑物場(chǎng)景可能耗費(fèi)數(shù)周甚至更久,而這種一鍵生成式場(chǎng)景帶來的效率提升超乎想象。

那么,混元3D世界模型是如何快速生成360°沉浸式視覺空間的呢?

從混元世界模型1.0的模型架構(gòu)來看,全景世界圖像生成技術(shù)作為連接文字、圖片與世界的統(tǒng)一代理系統(tǒng),會(huì)先生成初始化世界的全景圖,實(shí)現(xiàn)360°的全覆蓋場(chǎng)景。

隨后,系統(tǒng)會(huì)將整個(gè)3D世界解構(gòu)為不同層級(jí),如前景與背景、海洋與地面、地面與天空等,再基于這些層級(jí)進(jìn)行3D世界重建,最終形成3D世界模型。

與傳統(tǒng)3D場(chǎng)景開發(fā)相比,這種一鍵生成式場(chǎng)景不僅節(jié)省大量時(shí)間,還能輸出標(biāo)準(zhǔn)化的可漫游3D Mesh資產(chǎn),兼容Unity、Unreal Engine等工具。

而且,生成內(nèi)容的精度已達(dá)可直接使用水平:前景內(nèi)的注意力區(qū)域細(xì)節(jié)呈現(xiàn)到位,背景與前景分離度足夠,無界限不清晰、光影模糊等問題。

但在官網(wǎng)體驗(yàn)混元3D世界模型會(huì)發(fā)現(xiàn),它無法完全還原文字中的所有要求,只能還原大致的場(chǎng)景需求、光影顏色以及前景區(qū)域的細(xì)節(jié)。

例如,下圖對(duì)應(yīng)的文本要求中提到了機(jī)械世界、機(jī)器人等元素,但未在生成的場(chǎng)景中呈現(xiàn)。系統(tǒng)只是提煉了與構(gòu)建大體世界場(chǎng)景相關(guān)的詞匯,如賽博廢土風(fēng)格、天空中紅色的落日等,然后分離出前景與背景 —— 將 “廢棄的游樂場(chǎng)” 解構(gòu)為前景內(nèi)容,紅色落日作為背景天空內(nèi)容,再基于這些層級(jí)重建3D世界場(chǎng)景,即僅還原了場(chǎng)景的大致需求。

可見,混元3D世界模型目前還無法滿足用戶的個(gè)性化需求,但已能初步構(gòu)建出前景、背景以及簡(jiǎn)單的場(chǎng)景細(xì)節(jié),可在游戲開發(fā)等工作中節(jié)省不少時(shí)間。

此外,這種依照用戶要求生成的3D世界模型對(duì)普通玩家而言也極具可玩性。直接輸出3D Mesh資產(chǎn)帶來了格式的統(tǒng)一和學(xué)習(xí)成本的降低,當(dāng)AI能夠完成場(chǎng)景解構(gòu)和3D構(gòu)建工作時(shí),用戶的主觀能動(dòng)性就成了決定生成場(chǎng)景的唯一變量。

3D模型熱潮涌起,25年能否走向平民化?

騰訊此次將混元3D世界模型普及至消費(fèi)級(jí)顯卡,目的是吸引廣大開發(fā)者與創(chuàng)作者加入 “騰訊混元3D” 生態(tài)。該模型支持從3D模型到3D世界場(chǎng)景的全流程內(nèi)容生成,用戶能創(chuàng)造自己的虛擬世界。

當(dāng)前市面上,支持3D模型生成的AI大模型眾多,如Tripo AI、Meshy AI、GENIE等。眾多玩家爭(zhēng)搶3D化賽道,導(dǎo)致產(chǎn)品功能高度同質(zhì)化,也反映出 “將現(xiàn)實(shí)場(chǎng)景搬進(jìn)虛擬世界” 是各廠商的核心競(jìng)爭(zhēng)點(diǎn)。

在這些AI工具中,硅谷初創(chuàng)企業(yè)VAST于2024年發(fā)布的AI 3D基礎(chǔ)模型Tripo AI憑借獨(dú)特的產(chǎn)品結(jié)構(gòu)脫穎而出。

與面向更廣泛用戶的騰訊混元3D不同,Tripo AI的定位更偏向?qū)I(yè)創(chuàng)作者:進(jìn)入頁面后,用戶可直接通過文字或圖片生成3D模型,且可調(diào)參數(shù)相對(duì)豐富,不僅支持紋理生成功能,還能自動(dòng)拆分模型部件,讓每個(gè)拆解后的部件可單獨(dú)編輯,甚至支持為模型部件綁定基礎(chǔ)動(dòng)畫并演示,不過演示過程中偶爾會(huì)出現(xiàn)部件變形問題。總體而言,Tripo AI是一款功能成熟、可適配多場(chǎng)景的AI 3D工具。

同樣在2024年推出的Meshy AI(由國內(nèi)團(tuán)隊(duì)創(chuàng)建),雖也支持通過文字、圖像直接生成3D模型,但其核心優(yōu)勢(shì)在于更完善的社區(qū)功能:用戶可在社區(qū)內(nèi)瀏覽其他創(chuàng)作者的3D模型作品,平臺(tái)對(duì)模型的分類細(xì)化清晰,還標(biāo)注了互動(dòng)量、點(diǎn)贊數(shù)、是否支持3D打印等關(guān)鍵信息。這一設(shè)計(jì)讓新手用戶能直接下載現(xiàn)成的3D模型使用,同時(shí)也提升了社區(qū)的傳播度與活躍度。

而由Luma AI推出的GENIE工具,除支持文本轉(zhuǎn)3D模型、多格式(如OBJ、FBX等)導(dǎo)出以適配不同場(chǎng)景外,最大亮點(diǎn)是提供API接口,用戶可通過該接口直接將視頻內(nèi)容轉(zhuǎn)化為3D模型,形成差異化競(jìng)爭(zhēng)力。

不難看出,上述產(chǎn)品均憑借自身特色在同質(zhì)化競(jìng)爭(zhēng)中突圍,騰訊混元3D也不例外。盡管其3D模型生成功能與其他工具未拉開明顯差距,但 “高免費(fèi)額度” 是其核心優(yōu)勢(shì):在混元AI 3D官網(wǎng),每位用戶每天可免費(fèi)生成20次模型,次數(shù)耗盡后還能通過分享好友重新獲取。這種 “以量換用戶” 的推廣策略相當(dāng)成功,在3D世界模型Lite版發(fā)布前,其社區(qū)模型下載量已達(dá)230萬次,成為全球最受歡迎的3D開源模型平臺(tái)之一。

此次騰訊推出適配消費(fèi)級(jí)顯卡的混元3D世界模型Lite版,必將吸引更多創(chuàng)作者加入其生態(tài)。用戶規(guī)模的增長,將進(jìn)一步推動(dòng)反饋迭代與應(yīng)用場(chǎng)景拓展:以當(dāng)下熱門的VR眼鏡為例,混元3D導(dǎo)出的3D世界模型文件可直接導(dǎo)入使用,用戶只需擁有VR設(shè)備,就能隨時(shí)隨地沉浸在自己創(chuàng)建的虛擬場(chǎng)景中,實(shí)現(xiàn)生態(tài)與硬件的聯(lián)動(dòng);同時(shí),AI 3D基礎(chǔ)模型能讓普通用戶輕松制作高度自定義的3D模型,與3D打印機(jī)形成協(xié)同。

更重要的是,AI 3D化近乎 “零學(xué)習(xí)成本” 的特性,正推動(dòng)其快速滲透至各行業(yè):在建筑規(guī)劃、室內(nèi)設(shè)計(jì)、電商展示等場(chǎng)景中,3D可視化內(nèi)容比文字或傳統(tǒng)圖紙更易理解,工作人員無需復(fù)雜學(xué)習(xí)即可輸出場(chǎng)景內(nèi)容,大幅減少重復(fù)建模的時(shí)間;這種 “虛擬模型 + 實(shí)體行業(yè)” 的聯(lián)動(dòng),既能提升用戶粘性,又能讓用戶因高度自定義內(nèi)容產(chǎn)生歸屬感。種種趨勢(shì)表明,3D模型在2025年勢(shì)必走向大眾化。

小雷認(rèn)為,未來的AI 3D模型將進(jìn)一步整合專業(yè)場(chǎng)景模型與創(chuàng)作風(fēng)格,通過細(xì)分領(lǐng)域和使用場(chǎng)景吸引更多垂直用戶,不斷拓展生態(tài)邊界并滲透到各類生活化場(chǎng)景中。

而這,正是本次3D模型平民化浪潮的核心意義 —— 在現(xiàn)實(shí)與虛擬交融的當(dāng)下,讓每個(gè)人都擁有構(gòu)建3D虛擬世界的能力。

3D模型普及,3D建模師會(huì)失業(yè)嗎?

不過,網(wǎng)上有一種觀點(diǎn)認(rèn)為,隨著3D模型的普及,3D建模師會(huì)面臨失業(yè)風(fēng)險(xiǎn)。對(duì)此,小雷并不認(rèn)同。

不可否認(rèn),這類能快速生成3D模型的工具會(huì)對(duì)行業(yè)產(chǎn)生沖擊。AI模型 “快速高效” 的優(yōu)勢(shì)是人類難以企及的;但如前文所說,當(dāng)前的AI 3D模型尚無法實(shí)現(xiàn)真正的用戶個(gè)性化,其生成的產(chǎn)物本質(zhì)上是基于大模型學(xué)習(xí)數(shù)據(jù)產(chǎn)出的 “復(fù)刻式內(nèi)容”。

而缺乏個(gè)性的內(nèi)容難以成為優(yōu)秀作品。無論是游戲建模還是建筑設(shè)計(jì),讓人記住的永遠(yuǎn)是獨(dú)具匠心的設(shè)計(jì),是3D建模師反復(fù)打磨的細(xì)節(jié)和為適配用戶需求的巧思。因此小雷認(rèn)為,以當(dāng)前AI 3D模型的能力,想要完全取代3D建模師基本不可能;相反,作為能高效執(zhí)行重復(fù)性指令的工具,它更適合成為建模師提升效率的 “輔助幫手”。

其實(shí),“AI輔助創(chuàng)作” 的模式早已在各行業(yè)滲透。但受限于內(nèi)容同質(zhì)化問題,AI往往只能停留在 “重復(fù)的基礎(chǔ)構(gòu)建” 環(huán)節(jié)。

這也是雷科技在如今AI寫作工具便捷普及的情況下,仍堅(jiān)持原創(chuàng)的原因,小雷始終認(rèn)為,真正有深度、有溫度的好文章,不會(huì)因AI的存在而失色。

本文來自“雷科技”,36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com