0
| 本文作者: nebula | 2026-04-16 15:25 |
4月16日,騰訊正式發(fā)布并開源混元3D世界模型2.0( HY-World 2.0)。HY-World 2.0是一個多模態(tài)世界模型,能夠理解文字、圖片、視頻等不同類型輸入,自動生成、重建和模擬 3D 世界,同時支持多格式3D資產(chǎn)(Mesh/3DGS/點云等)導(dǎo)出,可以與現(xiàn)有的游戲工作流無縫對接,用于快速生成游戲地圖和關(guān)卡原型。
混元世界模型 2.0讓 AI 從“對話”、“畫圖”、“捏物體”,進(jìn)化到了“造世界”——包含人、物、景的完整世界。不同于谷歌的Genie 3和混元世界模型1.5僅能生成視頻文件,世界模型2.0的實用性更進(jìn)一步:它可以直接生成可二次編輯的3D資產(chǎn)文件,這些生成的3D資產(chǎn)可以直接導(dǎo)入到游戲制作或者具身仿真引擎,實現(xiàn)真正可玩、可用。
目前,世界模型2.0已經(jīng)上線至騰訊混元3D創(chuàng)作引擎官網(wǎng),用戶可以申請使用。(申請使用地址:https://3d.hunyuan.tencent.com/sceneTo3D)

實機演示:輸入“生成一個日式RPG風(fēng)格的中世紀(jì)地牢”,即可生成一個3D空間資產(chǎn)
實機演示:輸入“生成一個溫馨的繪本風(fēng)格小木屋”,游戲角色可以自由穿行在生成的3D場景中
所有內(nèi)容均為3D文件,且全部由HY-World 2.0大模型一鍵生成
混元世界模型2.0支持文、圖、視頻多種輸入。輸入一段文字或一張圖片,模型即可精準(zhǔn)解析復(fù)雜語義,一鍵生成風(fēng)格多樣的可漫游世界。相比較混元世界模型1.0,2.0的模型架構(gòu)全面升級,畫面精細(xì)度和真實感大幅提升。用戶還可以自定義風(fēng)格,按需生成真實風(fēng)、漫畫風(fēng)、游戲風(fēng)的3D空間。生成完成后,用戶可以將資產(chǎn)導(dǎo)入到Unity、UE 等引擎、進(jìn)行二次編輯,顯著降低了游戲地圖的創(chuàng)作門檻。

模型還支持角色模式,用戶可以操作角色在街道、建筑、場景中自由探索,不限時間,具有物理碰撞,就像在游戲里一樣。

同時,世界模型2.0支持復(fù)刻真實3D場景,用戶輸入一段真實空間的視頻或者多視角圖片,模型就能構(gòu)建出高精度的數(shù)字孿生空間。基于升級后的 WorldMirror 2.0 架構(gòu),模型支持任意尺寸圖像與視頻輸入,一次性預(yù)測密集點云、多視角深度圖、表面法線及相機參數(shù) ,一次生成永久可復(fù)用。未來,室內(nèi)裝修預(yù)覽、城市規(guī)劃、文化遺產(chǎn)保護(hù)等場景,都可以基于這一能力實現(xiàn)快速構(gòu)建和還原。

混元世界模型2.0以3D為主軸,通過統(tǒng)一空間理解、生成、重建的架構(gòu),實現(xiàn)了SOTA級的生成效果。與其他世界模型相比,混元世界模型2.0在場景完整度(物體側(cè)面和背面)以及對輸入圖片的遵循程度表現(xiàn)更優(yōu)。混元生成的3DGS與Mesh的混合表征,也讓用戶能夠開啟角色模式進(jìn)行有真實物體碰撞的交互。
混元世界模型(HY-World 系列)自發(fā)布以來就在持續(xù)進(jìn)化:從首個開源的3D世界模型 HY-World 1.0 ,到可實時在線交互的 HY-World 1.5 ,再到一鍵生成3D空間資產(chǎn)的 HY-World 2.0,騰訊混元的3D世界模型正在一步步將“AI 造世界”從概念變?yōu)楝F(xiàn)實。
2025年下半年以來,騰訊引入多位高級人才、加快研發(fā)架構(gòu)升級、持續(xù)加大混元大模型研發(fā)效率,并取得了顯著成果。2025年12月,混元發(fā)布大語言模型2.0版本,推理能力與效率居國內(nèi)頂尖行列;智能水平更高的新模型 HY3 也在內(nèi)部業(yè)務(wù)測試中,在元寶App測試中獲得明顯正向收益。此次混元世界模型2.0發(fā)布,是混元在多模態(tài)領(lǐng)域的又一突破。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。