对话腾讯混元团队：新发AI生3D模型，能看清每一根羽毛

知危 · 公众号 · · 2025-04-24 19:30

正文

请到「今天看啥」查看全文

。

相比 v2.0 版本，混元 3D v2.5 模型总参数量从 1B 提升至 10B，有效面片数增加超 10 倍，表面更平整、边缘更锐利、细节更丰富，有效几何分辨率达到1024，“ 就像从标清升级到了超清画质。”

比如这张官方展示的法线图，人脸、身体、翅膀都有非常清晰的轮廓和细节结构。

再看看知危的实测效果，对比 v2.0 版本和 v2.5 版本的暴龙兽法线图，在皮肤纹理、头骨边界甚至角的纹理等细节的差距非常明显。

贴图质量也更加好，阴影效果很明显。

通过 v2.5 版本生成并添加了 PBR 贴图的战斗暴龙兽，也更有了实体模型的感觉，只是这次头盔上的角没有还原是个小遗憾。

我们还尝试了文生 3D，下图是通过文生 3D 得到的中世纪骑士持剑骑马的形象，添加了 PBR 贴图，除了战马身上的布匹不够破烂、角状头盔羽冠成了角之外，基本都遵循了提示，纹理质量和光影效果也很好。

提示词：

一位中世纪骑士骑着战马驰骋，他身披华丽却饱经战火的盔甲，披着飘逸的斗篷，手持巨大的剑。骑士的盔甲上镌刻着符文，部分已然失去光泽，头盔上窄窄的面甲上饰有角状的羽冠。战马肌肉发达，身披金属铠甲，披着破烂的布匹。

然后是 3D 人脸生成，这是单图生成的 3D 版莫扎特。

对比原图，可以看到虽然 3D 对象本身质量很高，但和本人没那么像，结合社区的反馈，混元 3D 目前对人脸细微特征的还原度确实还不够高。

莫扎特画像（图源：维基百科）

最后提醒一下，在做单图生成的时候，输入图片的视角很重要，最好是 45 度侧视角，这样能包含足够多的对象信息。如果是正视图，是有较大概率失败的。

比如在 v2.0 版本下生成的亚古兽，头部过于扁平了。

输入原图是：

亚古兽（图源：DigimonWiki ）

这仅仅是一次轻量级的测评，混元 3D 还有大量功能比如智能减面、纹理生成、草图生 3D、小游戏创作等可以去尝试。

AI 生 3D 技术发展迅速，但其实整体还处在非常早期的阶段，真实性和可控性都是初级水平，这也是目前在技术层面解放开发者创意发挥的最大障碍。

眼下，越来越多独立开发者或小型工作室将AI生成内容嵌入游戏中，以增强游戏内容的多样性和不确定性，以及降低开发成本，比如“ Infinite Craft ”、“ ChatNPC ”、“ Talking Coin ”、“ telAIphone ”、“ 沙威玛传奇 ” 等。其中，“ 沙威玛传奇 ” 大量使用了 AI 作画、AI 作曲、AI 配音。

然而，不同模态的 AI 生成技术，要整合进复杂的人类工作流，都要先后经历真实性和可控性两道大关，目前各自发展成熟度差距明显。文本生成已经到探索强推理的阶段；图像生成刚刚见证 GPT-4o 带来的精准文字、图表生成能力；视频生成的角色和场景一致性不断增强，但动态和物理理解仍有欠缺，尚未迈过第一道坎。