正文
。
相比 v2.0 版本,混元 3D v2.5 模型总参数量从 1B 提升至 10B,有效面片数增加超 10 倍,表面更平整、边缘更锐利、细节更丰富,有效几何分辨率达到1024,“ 就像从标清升级到了超清画质。”
比如这张官方展示的法线图,人脸、身体、翅膀都有非常清晰的轮廓和细节结构。
再看看知危的实测效果,对比 v2.0 版本和 v2.5 版本的暴龙兽法线图,在皮肤纹理、头骨边界甚至角的纹理等细节的差距非常明显。
贴图质量也更加好,阴影效果很明显。
通过 v2.5 版本生成并添加了 PBR 贴图的战斗暴龙兽,也更有了实体模型的感觉,只是这次头盔上的角没有还原是个小遗憾。
我们还尝试了文生 3D,下图是通过文生 3D 得到的中世纪骑士持剑骑马的形象,添加了 PBR 贴图,除了战马身上的布匹不够破烂、角状头盔羽冠成了角之外,基本都遵循了提示,纹理质量和光影效果也很好。
提示词:
一位中世纪骑士骑着战马驰骋,他身披华丽却饱经战火的盔甲,披着飘逸的斗篷,手持巨大的剑。骑士的盔甲上镌刻着符文,部分已然失去光泽,头盔上窄窄的面甲上饰有角状的羽冠。战马肌肉发达,身披金属铠甲,披着破烂的布匹。
然后是 3D 人脸生成,这是单图生成的 3D 版莫扎特。
对比原图,可以看到虽然 3D 对象本身质量很高,但和本人没那么像,结合社区的反馈,混元 3D 目前对人脸细微特征的还原度确实还不够高。
莫扎特画像( 图源:维基百科 )
最后提醒一下,在做单图生成的时候,输入图片的视角很重要,最好是 45 度侧视角,这样能包含足够多的对象信息。如果是正视图,是有较大概率失败的。
比如在 v2.0 版本下生成的亚古兽,头部过于扁平了。
输入原图是:
亚古兽( 图源:DigimonWiki )
这仅仅是一次轻量级的测评,混元 3D 还有大量功能比如智能减面、纹理生成、草图生 3D、小游戏创作等可以去尝试。
AI 生 3D 技术发展迅速,但其实整体还处在非常早期的阶段,真实性和可控性都是初级水平,这也是目前在技术层面解放开发者创意发挥的最大障碍。
眼下,越来越多独立开发者或小型工作室将AI生成内容嵌入游戏中,以增强游戏内容的多样性和不确定性,以及降低开发成本,比如“ Infinite Craft ”、“ ChatNPC ”、“ Talking Coin ”、“ telAIphone ”、“ 沙威玛传奇 ” 等。其中,“ 沙威玛传奇 ” 大量使用了 AI 作画、AI 作曲、AI 配音。
然而,不同模态的 AI 生成技术,要整合进复杂的人类工作流,都要先后经历真实性和可控性两道大关,目前各自发展成熟度差距明显。文本生成已经到探索强推理的阶段;图像生成刚刚见证 GPT-4o 带来的精准文字、图表生成能力;视频生成的角色和场景一致性不断增强,但动态和物理理解仍有欠缺,尚未迈过第一道坎。