专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
目录
相关文章推荐
新闻广角  ·  福建8名“六合彩”头家被抓!已被提起公诉 ·  23 小时前  
新闻广角  ·  荔枝价格暴跌七成 ·  2 天前  
新闻广角  ·  知名品牌被曝吃出活蛆!最新回应 ·  3 天前  
51好读  ›  专栏  ›  知危

对话腾讯混元团队:新发AI生3D模型,能看清每一根羽毛

知危  · 公众号  ·  · 2025-04-24 19:30

正文

请到「今天看啥」查看全文



相比 v2.0 版本,混元 3D v2.5 模型总参数量从 1B 提升至 10B,有效面片数增加超 10 倍,表面更平整、边缘更锐利、细节更丰富,有效几何分辨率达到1024,“ 就像从标清升级到了超清画质。”


比如这张官方展示的法线图,人脸、身体、翅膀都有非常清晰的轮廓和细节结构。



再看看知危的实测效果,对比 v2.0 版本和 v2.5 版本的暴龙兽法线图,在皮肤纹理、头骨边界甚至角的纹理等细节的差距非常明显。



贴图质量也更加好,阴影效果很明显。



通过 v2.5 版本生成并添加了 PBR 贴图的战斗暴龙兽,也更有了实体模型的感觉,只是这次头盔上的角没有还原是个小遗憾。



我们还尝试了文生 3D,下图是通过文生 3D 得到的中世纪骑士持剑骑马的形象,添加了 PBR 贴图,除了战马身上的布匹不够破烂、角状头盔羽冠成了角之外,基本都遵循了提示,纹理质量和光影效果也很好。


提示词:


一位中世纪骑士骑着战马驰骋,他身披华丽却饱经战火的盔甲,披着飘逸的斗篷,手持巨大的剑。骑士的盔甲上镌刻着符文,部分已然失去光泽,头盔上窄窄的面甲上饰有角状的羽冠。战马肌肉发达,身披金属铠甲,披着破烂的布匹。



然后是 3D 人脸生成,这是单图生成的 3D 版莫扎特。



对比原图,可以看到虽然 3D 对象本身质量很高,但和本人没那么像,结合社区的反馈,混元 3D 目前对人脸细微特征的还原度确实还不够高。


莫扎特画像( 图源:维基百科 )


最后提醒一下,在做单图生成的时候,输入图片的视角很重要,最好是 45 度侧视角,这样能包含足够多的对象信息。如果是正视图,是有较大概率失败的。


比如在 v2.0 版本下生成的亚古兽,头部过于扁平了。



输入原图是:


亚古兽( 图源:DigimonWiki )


这仅仅是一次轻量级的测评,混元 3D 还有大量功能比如智能减面、纹理生成、草图生 3D、小游戏创作等可以去尝试。


AI 生 3D 技术发展迅速,但其实整体还处在非常早期的阶段,真实性和可控性都是初级水平,这也是目前在技术层面解放开发者创意发挥的最大障碍。


眼下,越来越多独立开发者或小型工作室将AI生成内容嵌入游戏中,以增强游戏内容的多样性和不确定性,以及降低开发成本,比如“ Infinite Craft ”、“ ChatNPC ”、“ Talking Coin ”、“ telAIphone ”、“ 沙威玛传奇 ” 等。其中,“ 沙威玛传奇 ” 大量使用了 AI 作画、AI 作曲、AI 配音。


然而,不同模态的 AI 生成技术,要整合进复杂的人类工作流,都要先后经历真实性和可控性两道大关,目前各自发展成熟度差距明显。文本生成已经到探索强推理的阶段;图像生成刚刚见证 GPT-4o 带来的精准文字、图表生成能力;视频生成的角色和场景一致性不断增强,但动态和物理理解仍有欠缺,尚未迈过第一道坎。







请到「今天看啥」查看全文