专栏名称: AI产品阿颖
关注分布式相关的开源项目和基础架构,致力于分析并报道这些新技术是如何以及将会怎样影响企业的软件构建方式。
目录
相关文章推荐
宝玉xp  ·  回复@只爱钱的sin-na:除非你大量使用G ... ·  18 小时前  
新机器视觉  ·  从YOLOv5到YOLO11!改进有多大? ·  昨天  
黄建同学  ·  还记得Figure那个分拣机器人吗?Bret ... ·  2 天前  
51好读  ›  专栏  ›  AI产品阿颖

腾讯,悄悄干了件大事。

AI产品阿颖  · 公众号  · AI  · 2025-06-18 10:25

主要观点总结

本文介绍了腾讯在3D生成领域的突破性进展,通过开源混元3D模型,实现了从模型权重、训练代码到数据处理流程的全链路开源。该模型能够根据文本或图像自动生成3D模型,并具备高度的几何精度和纹理质量。腾讯在3D生成领域的实力已经得到了行业的认可,其模型效果领先,且不断迭代升级,为游戏、影视、文旅等行业提供了有力的支持。

关键观点总结

关键观点1: 腾讯在3D生成领域的创新

腾讯通过开源混元3D模型,在行业内率先做出了真正可用、完全开源的3D生成大模型。该模型从文本描述到几何精度和纹理质量都有显著提高,不断迭代升级,已经成为行业内的领先者。

关键观点2: 腾讯开源混元3D模型的影响

腾讯的开源模型对行业产生了重大影响,引起了行业内外的广泛关注。其模型的行业影响力和实用性能得到了广泛认可,推动了行业的发展。

关键观点3: 腾讯在3D生成领域的未来展望

随着技术的不断进步和需求的不断增长,腾讯在3D生成领域的前景广阔。其强大的技术实力和创新能力,以及对游戏、影视等行业的深入理解,使其成为行业的领跑者。未来,腾讯有望继续在3D生成领域取得更多的突破和进展。


正文

请到「今天看啥」查看全文


但这些模型基本都还停留在实验阶段,效果比较有限,细节、材质的质量和生成效率距离商业化落地还差得挺远,更重要的是也并未真正完全开源。所以实际用起来并不容易,开发者们想用这些模型做点具体业务、落地项目还是困难重重。

2024 年 11 月,腾讯发布了混元 3D 模型的初代版本(1.0),当时圈内关注的人不多,我自己也是最近回过头去补课才发现的。

初代模型大致能实现输入一段文本或一张图,就自动给你生成一个 3D 模型,甚至还能自动帮模型绑好骨骼,做出简单的动画效果。之前这些活基本得专门的建模师和动画师手工一点点来,现在初代版本的混元 3D 模型已经基本能帮开发者省掉不少时间。

重要的是,腾讯在当时就把模型完整地开源了出去,模型的权重、参数这些全都可以直接拿去用。 虽然初代版本的效果肯定不能跟现在比,但它确实给当时关注 3D 方向的人带来了不小的惊喜。

因为在那个阶段,OpenAI、Google 这些国际 AI 明星公司,在 3D 模型的研究方向上其实已经陷入了停滞状态。结果没想到,半路突然杀出了一家中国公司,居然率先做出了真正能用的开源 3D 模型。

两个多月后,也就是 2025 年的 1 月,腾讯继续更新了混元 3D 模型的 2.0 版本。这次发布的 2.0 版在效果上提升得还挺明显,主要体现在两个方面:

一方面是模型对文本描述的理解明显精准了不少,之前版本偶尔还会出现模型和文字描述对不上号的情况,现在基本上给一段文本,它能生成的 3D 模型形状和细节都准确得多了。

另一方面则是几何精度,这版生成的模型细节更多、轮廓更精确,当时已经明显超过行业内能拿得出手的几个主流 3D 模型。

几何精度是个行业内的专业名词。

我找朋友给我解释了下,他说“几何生成”其实就是用算法自动造出三维物体的形状。可以把它想象成小时候玩橡皮泥,捏出各种小动物、房子、汽车。

只不过这次不是用手捏,而是让电脑自己捏,输入一段描述,模型就能凭空生成出一个 3D 模型,比如一只猫、一把椅子。这个过程中,电脑要决定每个点、每条线、每个面的具体位置和形状。这就是所谓的几何生成。







请到「今天看啥」查看全文