-
官网地址:https://3d.hunyuan.tencent.com/sceneTo3D
- Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
- Hugging Face模型地址:https://huggingface.co/tencent/HunyuanWorld-1
- 技术报告地址:https://arxiv.org/abs/2507.21809
腾讯混元3D世界模型 1.0,是业界首个开源可编辑的世界生成模型,用户只需输入一句话或上传一张图片,就能生成一个完整、可漫游的3D世界,这一创新不仅降低了3D内容创作的门槛,也为游戏开发、VR、数字内容创作等领域带来了全新的可能性。
通过结合全景生成与层次化3D重建等技术,混元3D世界模型1.0 同时支持文字或者图片输入,实现了可交互、可编辑、高质量的360度可漫游场景生成。混元3D世界模型的技术亮点在于其全方位的场景生成能力和高度的可编辑性。通过层次化3D场景表征及生成算法,该模型支持3D Mesh导出,在保证生成场景的逼真度和沉浸感的同时,兼容已有CG管线进行二次开发,如游戏开发、物理仿真、场景编辑等。
自发布以来,混元3D世界模型1.0在社区中备受关注,其卓越的世界生成能力为用户带来了全新AI体验。然而,显存开销大的问题是用户反馈的最大痛点,即使开启pipeline offloading(流水线卸载)技术,仍需26GB以上显存,大多数消费级显卡无法运行。
为了让更多中小企业及个人开发者能够便捷使用混元3D世界模型1.0,混元团队推出了混元3D世界模型1.0–Lite版本,让消费级显卡也能跑世界模型。
效果说话,我们来看看混元世界模型1.0–Lite 消费级显卡运行效果。
首先,360°全景:
亮点:一键生成360°沉浸式视觉空间,支持文本或者单张图片输入,精准理解复杂语义,智能推理并延展360°全景视野,构建沉浸式VR体验。
原创文章,作者:feiniu,如若转载,请注明出处:https://www.lrblog.cn/364.html