主要观点总结
本文回顾了12月AI领域的重要事件,包括多个大型AI系统的发布,并重点介绍了世界模型的趋势。文章介绍了世界模型的本质、发展现状以及未来可能的发展趋势,包括其与其他技术路线的区别,相关重要科学家和实践者,以及世界模型在互联网语料获取难度增加的情况下的优势。同时,也推荐了关注得到头条以获取更多知识新闻。
关键观点总结
关键观点1: AI领域在12月集中发布多个大型AI系统。
包括李飞飞公司的LWM、谷歌的Genie2等,这些产品的发布体现了世界模型的趋势。
关键观点2: 世界模型的本质。
世界模型是直接观察现实,从现实中抽象出常识,并基于常识展开预测和行动的技术。它与目前主流的大语言模型有所不同。
关键观点3: 世界模型的重要科学家和实践者。
杨立昆是世界模型的重要科学家之一,而李飞飞的World Labs则是重要的实践者之一。
关键观点4: 世界模型在互联网语料获取难度增加的情况下的优势。
随着互联网语料的获取难度增加,世界模型的发展可能会追上并超越大语言模型,因为它不局限于网络上的信息,而且对素材的需求量小得多。
关键观点5: 推荐关注得到头条以获取更多知识新闻。
得到头条是得到APP的一档日更栏目,提供新鲜、有料、有趣的知识新闻。
正文
其间其他公司的动作还有很多,咱们就不展开了。就像前面说的,世界头部的几家AI公司就像年底冲业绩一样,集中在12月发布了一批王炸级的产品。
我们要说的重点并不是这些产品本身,而是
年底这轮AI群像里体现出的一个明显的趋势。这就是,世界模型。
李飞飞创立的World Labs,定位是
空间智能
,属于世界模型。而谷歌的新产品
Genie2
,也自称是世界模型。这两个AI的功能很像,都是给它输入一张图片,它就能给你生成一个完整的3D环境。比如,给它看一张演唱会的照片,它就能生成一个演唱会的3D模型。你可以像玩3D游戏一样在这个模型里游览。
除了谷歌和李飞飞的公司,
OpenAI
今年也高调布局了人形机器人领域,投资了相关的公司,
而人形机器人最重要的底层支撑,就是世界模型。
未来一年,你可能会在媒体上看到更多关于世界模型的报道。因此今天,我们就展开说说这个
世界模型
,算是对明年可能的趋势做个事先的科普打底。
很多人第一次听说世界模型,是从
杨立昆
开始的。
在ChatGPT刚火起来,所有媒体都在一路追捧的时候,法国的AI科学家杨立昆就说,OpenAI的大语言模型能力非常有限,要想达到AGI,也就是通用人工智能,还得走世界模型路线。
在这里要特别强调一下杨立昆这个人。
这是AI领域现存于世的辈分最高,影响力最大,贡献最大的科学家之一。
早在1988年,杨立昆就在大名鼎鼎的贝尔实验室任职,跟信息论之父香农、晶体管发明者肖克利算是同门师兄弟。
根据李飞飞在自传里的回忆,杨立昆也给过她重要的启迪。
在贝尔实验室期间,杨立昆开始训练神经网络识别签名。他从美国邮政署拿到了7200多份各类字体的手写扫描件,并且用它们来训练神经网络。后来,这个研究成果被银行采纳,用在自助取款机上,可以读取支票上的数字。而当时是1993年,没错,是31年前。