专栏名称: 罗辑思维
每天一段60秒语音,一篇新角度看世界的文章。关注罗胖,让你每天比别人知道的多一些。
目录
相关文章推荐
罗辑思维  ·  存款利率正接近零,送你9个应对策略 ·  昨天  
纯银V  ·  续航几小时???-20250608155817 ·  昨天  
半佛仙人  ·  严重怀疑京东外卖是蜜雪冰城的后台 ·  昨天  
连岳  ·  人无法记住3岁前的事,为什么? ·  3 天前  
51好读  ›  专栏  ›  罗辑思维

十二月AI又双叒爆发了:世界模型,曙光乍现

罗辑思维  · 公众号  · 热门自媒体  · 2024-12-17 06:30

主要观点总结

本文回顾了12月AI领域的重要事件,包括多个大型AI系统的发布,并重点介绍了世界模型的趋势。文章介绍了世界模型的本质、发展现状以及未来可能的发展趋势,包括其与其他技术路线的区别,相关重要科学家和实践者,以及世界模型在互联网语料获取难度增加的情况下的优势。同时,也推荐了关注得到头条以获取更多知识新闻。

关键观点总结

关键观点1: AI领域在12月集中发布多个大型AI系统。

包括李飞飞公司的LWM、谷歌的Genie2等,这些产品的发布体现了世界模型的趋势。

关键观点2: 世界模型的本质。

世界模型是直接观察现实,从现实中抽象出常识,并基于常识展开预测和行动的技术。它与目前主流的大语言模型有所不同。

关键观点3: 世界模型的重要科学家和实践者。

杨立昆是世界模型的重要科学家之一,而李飞飞的World Labs则是重要的实践者之一。

关键观点4: 世界模型在互联网语料获取难度增加的情况下的优势。

随着互联网语料的获取难度增加,世界模型的发展可能会追上并超越大语言模型,因为它不局限于网络上的信息,而且对素材的需求量小得多。

关键观点5: 推荐关注得到头条以获取更多知识新闻。

得到头条是得到APP的一档日更栏目,提供新鲜、有料、有趣的知识新闻。


正文

请到「今天看啥」查看全文


其间其他公司的动作还有很多,咱们就不展开了。就像前面说的,世界头部的几家AI公司就像年底冲业绩一样,集中在12月发布了一批王炸级的产品。
我们要说的重点并不是这些产品本身,而是 年底这轮AI群像里体现出的一个明显的趋势。这就是,世界模型。
李飞飞创立的World Labs,定位是 空间智能 ,属于世界模型。而谷歌的新产品 Genie2 ,也自称是世界模型。这两个AI的功能很像,都是给它输入一张图片,它就能给你生成一个完整的3D环境。比如,给它看一张演唱会的照片,它就能生成一个演唱会的3D模型。你可以像玩3D游戏一样在这个模型里游览。
除了谷歌和李飞飞的公司, OpenAI 今年也高调布局了人形机器人领域,投资了相关的公司, 而人形机器人最重要的底层支撑,就是世界模型。
未来一年,你可能会在媒体上看到更多关于世界模型的报道。因此今天,我们就展开说说这个 世界模型 ,算是对明年可能的趋势做个事先的科普打底。

02

有了世界模型,世界有何不同?

很多人第一次听说世界模型,是从 杨立昆 开始的。 在ChatGPT刚火起来,所有媒体都在一路追捧的时候,法国的AI科学家杨立昆就说,OpenAI的大语言模型能力非常有限,要想达到AGI,也就是通用人工智能,还得走世界模型路线。
在这里要特别强调一下杨立昆这个人。 这是AI领域现存于世的辈分最高,影响力最大,贡献最大的科学家之一。 早在1988年,杨立昆就在大名鼎鼎的贝尔实验室任职,跟信息论之父香农、晶体管发明者肖克利算是同门师兄弟。
根据李飞飞在自传里的回忆,杨立昆也给过她重要的启迪。 在贝尔实验室期间,杨立昆开始训练神经网络识别签名。他从美国邮政署拿到了7200多份各类字体的手写扫描件,并且用它们来训练神经网络。后来,这个研究成果被银行采纳,用在自助取款机上,可以读取支票上的数字。而当时是1993年,没错,是31年前。






请到「今天看啥」查看全文