十二月AI又双叒爆发了：世界模型，曙光乍现

罗辑思维 · 公众号 · 热门自媒体 · 2024-12-17 06:30

主要观点总结

本文回顾了12月AI领域的重要事件，包括多个大型AI系统的发布，并重点介绍了世界模型的趋势。文章介绍了世界模型的本质、发展现状以及未来可能的发展趋势，包括其与其他技术路线的区别，相关重要科学家和实践者，以及世界模型在互联网语料获取难度增加的情况下的优势。同时，也推荐了关注得到头条以获取更多知识新闻。

关键观点总结

关键观点1: AI领域在12月集中发布多个大型AI系统。

包括李飞飞公司的LWM、谷歌的Genie2等，这些产品的发布体现了世界模型的趋势。

关键观点2: 世界模型的本质。

世界模型是直接观察现实，从现实中抽象出常识，并基于常识展开预测和行动的技术。它与目前主流的大语言模型有所不同。

关键观点3: 世界模型的重要科学家和实践者。

杨立昆是世界模型的重要科学家之一，而李飞飞的World Labs则是重要的实践者之一。

关键观点4: 世界模型在互联网语料获取难度增加的情况下的优势。

随着互联网语料的获取难度增加，世界模型的发展可能会追上并超越大语言模型，因为它不局限于网络上的信息，而且对素材的需求量小得多。

关键观点5: 推荐关注得到头条以获取更多知识新闻。

得到头条是得到APP的一档日更栏目，提供新鲜、有料、有趣的知识新闻。

正文

请到「今天看啥」查看全文

其间其他公司的动作还有很多，咱们就不展开了。就像前面说的，世界头部的几家AI公司就像年底冲业绩一样，集中在12月发布了一批王炸级的产品。

我们要说的重点并不是这些产品本身，而是 年底这轮AI群像里体现出的一个明显的趋势。这就是，世界模型。

李飞飞创立的World Labs，定位是 空间智能 ，属于世界模型。而谷歌的新产品 Genie2 ，也自称是世界模型。这两个AI的功能很像，都是给它输入一张图片，它就能给你生成一个完整的3D环境。比如，给它看一张演唱会的照片，它就能生成一个演唱会的3D模型。你可以像玩3D游戏一样在这个模型里游览。

除了谷歌和李飞飞的公司， OpenAI 今年也高调布局了人形机器人领域，投资了相关的公司， 而人形机器人最重要的底层支撑，就是世界模型。

未来一年，你可能会在媒体上看到更多关于世界模型的报道。因此今天，我们就展开说说这个 世界模型 ，算是对明年可能的趋势做个事先的科普打底。

有了世界模型，世界有何不同？

很多人第一次听说世界模型，是从 杨立昆 开始的。在ChatGPT刚火起来，所有媒体都在一路追捧的时候，法国的AI科学家杨立昆就说，OpenAI的大语言模型能力非常有限，要想达到AGI，也就是通用人工智能，还得走世界模型路线。

在这里要特别强调一下杨立昆这个人。 这是AI领域现存于世的辈分最高，影响力最大，贡献最大的科学家之一。 早在1988年，杨立昆就在大名鼎鼎的贝尔实验室任职，跟信息论之父香农、晶体管发明者肖克利算是同门师兄弟。

根据李飞飞在自传里的回忆，杨立昆也给过她重要的启迪。 在贝尔实验室期间，杨立昆开始训练神经网络识别签名。他从美国邮政署拿到了7200多份各类字体的手写扫描件，并且用它们来训练神经网络。后来，这个研究成果被银行采纳，用在自助取款机上，可以读取支票上的数字。而当时是1993年，没错，是31年前。