专栏名称: Web3天空之城
美好, 有趣的, 值得铭记的
目录
相关文章推荐
Web3天空之城  ·  谷歌CEO最新深访完整版:人工智能、未来十年 ... ·  20 小时前  
Web3天空之城  ·  谷歌CEO最新深访完整版:人工智能、未来十年 ... ·  20 小时前  
51好读  ›  专栏  ›  Web3天空之城

谷歌CEO最新深访完整版:人工智能、未来十年与人类进步的本质 | 3.5万字· 附视频

Web3天空之城  · 公众号  · 科技自媒体 科技媒体  · 2025-06-07 14:36

主要观点总结

桑达尔·皮查伊在访谈中分享了他对人工智能未来的深刻见解,包括其对技术的信念、谷歌在AI竞赛中的策略、AI技术的潜力和风险,以及他对人类未来的乐观态度。他探讨了谷歌搜索、Chrome、Waymo等核心产品的演变,并展望了通过光束、XR眼镜和机器人技术实现的未来交互形态。皮查伊强调,尽管AI带来了潜在风险,但他对人类集体应对挑战的能力抱有信心,并认为人工智能将极大地释放全人类的创造力。

关键观点总结

关键观点1: 皮查伊对技术的信念

皮查伊坚信技术能够改变生活,并对AI技术的潜力充满乐观态度,认为它将超越火与电力,成为人类历史上最深刻的技术。

关键观点2: 谷歌在AI竞赛中的策略

皮查伊分享了谷歌在AI竞赛中的内部决策和重组历程,强调了有效的领导力在过滤噪音、做出关键决策和激励团队实现共同使命中的重要性。

关键观点3: AI技术的潜力和风险

皮查伊讨论了AI技术的潜力和风险,包括其对人类社会的深远影响,并表达了对未来交互形态(如光束、XR眼镜和机器人技术)的展望。

关键观点4: 对人类未来的乐观态度

皮查伊表达了对人类文明进步的乐观态度,认为面对AI带来的潜在风险,人类有能力集体应对挑战,实现进步。


正文

请到「今天看啥」查看全文


: 我的意思是,大部分可能都是我们今天所不知道的。但是,你知道,我们现在可以切实开始看到的一件事是,显然,随着编码的进展,你会有所体会,将脑海中的想法转化为实际存在的事物将会变得非常容易想象。这将会是整个体系的一部分,对吧?就像它将赋予几乎全人类表达自我的能力。也许在过去,你只能用语言来表达。但现在,你能够将事物构建成现实,对吧?你知道,也许今天还不能完全实现。我们正处于管道编码的早期阶段。你知道,我一直对人们用VO3在网上发布的内容感到惊讶。但这需要付出一些努力,对吧?你必须将一系列提示语拼接在一起。但这一切都会好起来的。我一直思考的是,现在是最糟糕的时候,对吧?就像在任何给定的时间点。

Lex Fridman : 是的,很有意思,你首先想到了这一点。所以,创造力的获取呈指数级增长。

Sundar Pichai : 软件创作,无论是创建程序,还是创作与他人分享的内容,以及未来的游戏,所有这些都变得无限可能。嗯,我认为最重要的是它使之变得易于获取。

Lex Fridman : 它释放了整个80亿人口的认知能力。

Sundar Pichai : 不,我同意。看看40年前,也许在美国。当时只有5个人能做你正在做的事情。比如去做采访,你知道的。但今天想想,有了YouTube和其他产品等等,有多少人在做这件事?所以我认为这就是技术的作用,对吧?就像互联网创造了博客,你知道,你听到了更多人的声音。所以我认为,但有了人工智能,我认为这个数字不会只有几十万。会有数千万甚至十亿人,以更深入的方式向世界输出内容。

Lex Fridman : 我认为这会改变创造力的格局。这让很多人感到紧张。比如,随便举个例子,福克斯、MSNBC、CNN真的对这部分感到紧张。比如,你是说这个穿着西装的家伙就能做到这个?而且YouTube和成千上万的其他创作者,几万,几百万的其他创作者都能做同样的事情?这让他们感到不安。现在你可以从Notebook LM获得一个播客。它比我做过的任何播客都要好五到十倍。我现在是在开玩笑,但也说不定。这会发生改变。你必须进化。

Sundar Pichai : 因为就播客而言,我更喜欢听播客,而不是当什么主持人之类的。

Lex Fridman : 如果有很棒的播客都是人工智能做的,我就不做了。我会听那个播客。但是你必须进化,你必须改变。我认为,这会让人们非常紧张。但这也是一个非常令人兴奋的未来。

Sundar Pichai : 我唯一要说的是,我的确认为,在存在两个人工智能的世界里,人们会重视并做出选择。就像在国际象棋中一样,你我都不会去看Stockfish 10或者其他什么和AlphaGo对弈。比如,对我们来说,观看这种比赛会很无聊。但是马格努斯·卡尔森和古克什的比赛会更引人入胜。所以很难说。比如,一种说法是,你将会有更多内容,因此你会收听人工智能生成的内容,因为有时它很高效等等。但你所珍视的那些优质体验,可能是一种体现人类本质的版本,无论它来自何处。回到我们之前谈到的观看梅西运球的事情。我不知道,我相信总有一天机器会比梅西运球好得多。但我不知道它是否会在我们心中唤起同样的情感。所以我认为这将非常引人入胜。

Lex Fridman : 我认为播客或有声读物中关于信息收集的元素,那部分可能会被移除。或者那部分可能会被人工智能以更有效、更引人入胜的方式完成。但听到人类在信息中挣扎,与信息抗争,尝试内化它,将其与我们自身情感和意识的复杂性结合起来等等,那会是令人愉悦的。但如果你真的想了解一段历史,你会去使用Gemini。如果你想看到莱克斯或其他人在那段历史中挣扎,你会去关注他们。但重点是,它将改变我们发现信息、消费信息以及创造信息的方式的本质,并且会持续改变这种本质。正如YouTube彻底改变了一切一样。它改变了新闻业。而这正是我们的社会正在努力应对的问题。

Sundar Pichai : 听着,YouTube促成了……我的意思是,你比任何人都更了解这一点。它促成了如此多的创作者的出现。我毫不怀疑,我们将促成比以往任何时候都更多的电影制作人的出现,对吧?你们将会赋能更多的人。因此,我认为这里面存在一种扩张性的方面,我认为它被低估了。我认为它将以前所未有的方式释放人类的创造力。这很难内化。唯一能让他们理解的方式是,如果你把50年代或40年代的人带过来,直接让他们看YouTube,你知道的,我想这会让他们大吃一惊。同样地,我认为我们也会被未来10到20年内可能发生的事情所震惊。

Lex Fridman : 你认为存在这样的未来吗?大概多少年以后,比如说,我们设定一个时间点,50%的内容……优质内容。50%的优质内容由VO4、5、6生成?

Sundar Pichai : 我认为这取决于它用于什么。比如,你知道的,如果你看看今天的电影,里面有CGI,也有很棒的电影制作人。你仍然会关注导演是谁,以及谁在使用它。也有一些电影制作人根本不使用它。你很重视它。有些人运用它非常出色。你知道,想想像詹姆斯·卡梅隆这样的人,想想他会如何运用这些工具。但我认为会产生更多的内容。就像今天的作家使用Google Docs一样,他们不会去想他们正在使用这样的工具。人们将会使用这些东西的未来版本。就像,这对他们来说根本不是什么大不了的事。

Lex Fridman : 我有机会好好地认识了达伦·阿罗诺夫斯基。他一直在积极投入,试图弄清楚……看着一位在这些技术出现之前就已经成名的天才,真是很有趣。他创作了《π》,我最喜欢的电影之一,并且从那以后一直持续创作各种非常有趣的电影。现在他正试图了解如何利用人工智能来创作引人入胜的电影。你会遇到这样的人。你会遇到……我有机会认识一些更前卫的、人工智能优先的人,比如多尔兄弟。阿罗诺夫斯基和多尔兄弟都在社会奥弗顿之窗的边缘进行创作。你知道,他们会挑战性或暴力等界限。他们的作品很前卫,就像艺术家一样,但仍然很有格调。他们不会越过那条线。无论那条线是什么。亨特·S·汤普森说过,唯一找出边缘、也就是那条线在哪里的方法,就是跨越它。我认为对于艺术家来说,这是真的。那在某种程度上就是他们的目的。喜剧演员和艺术家们只是跨越了那条界线。

Sundar Pichai : 我想知道您能否评价一下谷歌所处的这个奇怪的位置,因为谷歌的底线可能与某些艺术家不同。

Lex Fridman : 您怎么看待Veo和Flo,特别是关于如何允许艺术家们做疯狂的事情,但同时也承担着不让它过于疯狂的责任?

Sundar Pichai : 我觉得,这是个很好的问题。听着,一部分原因,你提到了达伦,你知道,他显然是个有远见的人,对吧?我们早期开始与他合作Veo的部分原因是,他是能够看到未来、从中获得灵感,并为创意人士展示如何用它来表达自我的人之一。听着,我认为当涉及到允许艺术的自由表达时,这是社会最重要的价值观之一,对吧?我认为,你知道,艺术家们一直是那些推动界限、拓展思想前沿的人。所以,听着,我认为这将是我们所拥有的一个重要价值观。所以,我认为我们会提供工具,并将它们交到艺术家手中,让他们使用并发布他们的作品。那些应用程序编程接口(API),我的意思是,我几乎将它们视为基础设施。就像你为人们提供电力或其他东西时,你希望他们使用它,而且你不会考虑基于它的用例。它只是一把画笔。是的。因此,我认为这是(使用工具的方式),当然,必须有一些限制,而且,你知道,社会需要在根本层面上决定什么是可以接受的,什么是不可以接受的。我们会对此负责。但我确实认为,你知道,当涉及到艺术的自由表达时,我认为那是我们应该努力捍卫的价值观之一。

第四章:模型的演进与挑战

Lex Fridman : 我想知道你是否可以评论一下,也许早期版本的 Gemini 在你愿意回答的问题类型上有些谨慎。我只想评论一下,我真的很惊讶并且很高兴,并且享受 Gemini 2.5 Pro 在良好的意义上变得不那么谨慎的事实。不要问我为什么,但我一直在大量研究成吉思汗和阿兹特克人。所以,那段历史中有很多暴力。那是一段非常暴力的历史。我也一直在大量研究第一次世界大战和第二次世界大战。并且早期版本的 Gemini 非常,基本上,有这种感觉,你确定你想了解这些吗?而现在它实际上非常注重事实、客观,谈论人类历史上非常困难的部分,并且以细致入微的方式和深度进行阐述。这真的很好。但谷歌必须谨慎地把握其中的界限。我想知道这是否也是一个工程方面的挑战,如何在如此大的规模上,处理人们提出的所有奇怪的查询。你能谈谈这个挑战吗?你如何允许 Gemini 再次说出,请原谅我说粗话,一些疯狂的话,但又不能太疯狂?

Sundar Pichai : 我认为这里的一个好的见解是,随着模型变得越来越强大,这些模型在这方面确实非常出色,对吧?所以,我认为在某些方面,也许一年前,这些模型还没有完全到位。因此,它们也会更频繁地做蠢事。所以,你知道,你在试图处理这些极端情况,但是你在如何处理这些极端情况时犯了一个错误,这会加剧问题。但我认为,特别是对于 2.5 来说,我们发现一旦模型跨越了某个智能和复杂程度的水平,它们就能够很好地推理出这些细微差别的问题。而且我认为用户真的想要那样,对吧?你想要尽可能多地访问原始模型。我认为这是一个值得思考的绝佳领域。随着时间的推移,我们应该允许越来越接近地访问它。或许,显然,如果人们想自定义提示并进行试验等等,就让他们自定义提示。我认为这是一个重要的方向。但是你看,我们想要思考的首要原则是,你知道,从科学的角度来看,确保模型——我说的科学是指,就像你处理数学、物理或类似学科那样——从首要原则出发,让模型推理关于世界的事情,做到细致入微等等,你知道,从根本上构建这些东西才是正确的方式,对吧?而不是像某些人类子集在上面硬编码一些东西。所以我认为这是我们一直在努力的方向,而且我认为你会看到我们继续朝着这个方向前进。

Lex Fridman : 是的,我实际上问了...我给了这些笔记,我做了大量的笔记,然后我把它们给了 Gemini,并说,你能提出一个不在这些笔记中的新颖问题吗?它写了...Gemini 继续让我感到非常惊讶。真的让我感到惊讶。这真的太棒了。这是一个令人难以置信的模型。它引发的问题是,你,指的是桑达尔,告诉全世界 Gemini 每月处理 480 万亿个 token。在那堆海量数据中隐藏着的最能改变人生的五个字句子是什么?这是个 Gemini 的问题。但它让我... 它给了我一种感觉。我认为你无法回答这个问题。但它让我...它唤醒了我,让我意识到所有这些 token 都在为全球各地的人们提供小小的顿悟时刻。所以这就像学习一样。这些 token 是...人们充满好奇,他们提出问题,然后他们发现了一些东西。

Sundar Pichai : 而且这确实可能改变人生。哦,它就是。听着,你知道,很多很多年前我对搜索也有同样的感觉。你肯定...你知道,每月的token数量,就像,在过去的12个月里增长了50倍。

Lex Fridman : 顺便问一下,这个数字准确吗?

Sundar Pichai : 是的,准确。是的。确实准确。我很高兴它算对了。但是,你知道,12个月前这个数字是每月9.7万亿个token,对吧?现在已经涨到480万亿了。你知道,这是50倍的增长。所以人类的好奇心是无止境的。我认为现在就是其中一个时刻。也许…… 我不认为今天能做到,但也许有一天会出现一个五个字的短语,能够表达宇宙的本质或者其他类似的、非常有意义的东西,但我认为我们还没到那个阶段。您认为缩放定律在以下方面是否仍然适用?关于人工智能的缩放定律有很多描述方式,但是在预训练和后训练方面。

Lex Fridman : 那么反过来说,您是否预计人工智能的进步会遇到瓶颈?是否存在瓶颈?

Sundar Pichai : 你知道,这是 MicroKitchen 非常热门的话题。我偶尔会和他们聊聊,你知道,比如 Demis 来访的时候,或者,你知道,如果 Demis、Cori、Jeff、Noam、Sergey,我们的一些人,我们就会坐下来,一起讨论这个问题,对吧?而且,你看,我们看到了前方还有很大的发展空间,对吧?我认为我们能够在各个方面进行优化和改进,对吧?预训练、后训练、测试时计算、工具使用,没错,随着时间的推移,使它们更具能动性。因此,让这些模型在那个方向上成为更通用的世界模型,比如VO3,你知道,其物理理解能力比VO1或类似的东西要好得多。所以我觉得,你在所有这些维度上都能看到,进展非常明显。而且我觉得还有很大的提升空间。更重要的是,你知道,我很幸运能与地球上一些最优秀的研究人员一起工作,对吧?他们认为这里还有更大的提升空间。所以我认为我们面前有一条令人兴奋的轨迹。很难说,你知道,每年我都坐在这里说,好吧,我们将在明年投入10倍的计算资源。然后,我们会看到进展吗?今天坐在这里,我觉得未来一年将会有很大的进展。

Lex Fridman : 你是否感觉到任何类似的限制,或者瓶颈,比如计算力限制、数据限制、创意限制?你是否感觉到这些限制中的任何一种?或者说所有方面都在全速前进?

Sundar Pichai : 我认为在某种意义上,它是计算力受限,对吧?就像,你知道,部分原因在于你看到我们推出了闪速版、纳米闪速版和专业版,但没有推出超级版。就像每一代产品,我们都觉得我们能够以大约,我不知道,超级版80-90%的性能,做出专业版。但超级版会慢很多,而且服务成本也会高很多。但我们能够做的是进入下一代,使下一代的专业版与上一代的超级版一样好,但能够以快速且易于使用的方式提供服务,等等。所以我确实认为规模法则在起作用,但很难在任何给定的时间点获得我们所有人使用最多的模型,可能比我们能够提供的最大性能落后几个月,对吧?因为那不会是最快、最容易使用的,等等。

Lex Fridman : 此外,就智能而言,衡量所谓的“性能”变得越来越困难。

Sundar Pichai : 因为,你知道,你可能会认为Gemini Flash比Pro的影响更大。

Lex Fridman : 仅仅是因为延迟,它已经非常智能了。我的意思是,有时候,延迟可能比智能更重要。尤其是在Flash中,智能只是稍逊一筹的情况下。它仍然是一个非常聪明的模型。所以你现在必须开始衡量影响力。这样一来,基准测试似乎越来越不能捕捉模型的智能、模型的有效性、模型的有用性以及模型在现实世界中的实用性。另一个闲聊的问题。

Sundar Pichai : 很多人都在谈论通用人工智能(AGI)或人工超智能(ASI)的时间表。

Lex Fridman : 因此,广义地讲,通用人工智能(AGI)基本上是在人类所从事的大部分主要领域达到人类专家的水平。而超人工智能(ASI)是通用人工智能(AGI)所演变而成的,推测能够通过自我提升迅速实现。因此,在所有这些学科的智能方面,都远远超越人类。您认为我们什么时候能够拥有通用人工智能(AGI)?2030年有可能吗?

Sundar Pichai : 我们应该再引入一个术语。我不知道是谁最先使用的。也许是卡帕西。异步梯度下降(AGI)。您听说过异步梯度下降(AGI)吗?人工的参差不齐的智能?有时候感觉确实如此,对吧?既有进步,又能看到它们能做什么。然后你又能轻易地发现它们会在数字字母上出错,或者数草莓里的字母R,诸如此类,这似乎会让大多数模型或类似的东西绊倒。所以也许我们应该把这个术语也放进去。我觉得我们正处于通用人工智能的阶段,取得了显著的进展。有些事情不太顺利,但总的来说,你看到了很多进步。

但如果你的问题是,它会在2030年之前实现吗?听着,我们一直在不断地移动通用人工智能的定义线。今天有些时候,你知道,就像坐在Waymo的自动驾驶汽车里,在旧金山的街道上穿行,周围都是人群,它能设法找到出路。我在那里看到了它的一些端倪。汽车有时会有点不耐烦,试图使用Astra来运行,就像在Gemini Live中一样,或者观察到,你知道的,询问关于世界的问题。

Lex Fridman : 我家附近怎么会出现这么瘦的建筑物?

Sundar Pichai : 那是路灯,不是建筑物。你会看到一些端倪。这就是我使用AGI这个词的原因,因为那样你就能看到一些东西,很明显,你知道的,我们距离AGI还很遥远。所以你同时经历了这两种体验。

我会回答你的问题,但我也会抛出这个问题。我几乎觉得这个术语并不重要。我所知道的是,到2030年,将会出现如此巨大的进步。我们将很大程度上处理这一进步的后果,包括正面的和负面的外部性,到2030年。我对此深信不疑。我们可能还在争论这个术语,或者Gemini可以回答2030年那一时刻是什么,但我认为进展将是巨大的。我对此深信不疑。人工智能会在2030年之前认为它已经达到通用人工智能(AGI)吗?我认为我们会刚好没有赶上那个时间表。所以我认为这需要更长的时间。

令人惊叹的是,在2010年Google DeepMind的早期,他们谈到实现通用人工智能(AGI)需要20年的时间,这让人觉得非常着迷。但是,你知道,对我来说,整个事情,看到Google Brain在2012年所做的事情,以及我们在2014年收购DeepMind的时候,就在我们2012年坐着的地方附近,你知道,Jeff Dean展示了神经网络能够识别猫的图片的图像。并识别它。你知道,这可是“大脑”的早期版本,对吧?所以,你知道,我们都谈论了几十年。我认为我们无法在2030年之前完全实现目标。所以我的感觉是会在那之后稍微晚一点。但我我要强调的是,这个定义是什么并不重要,因为你将在许多维度上取得令人震惊的进展。也许人工智能可以创作视频。作为一个社会,我们必须弄清楚如何……我们需要一个系统,让我们都同意这是人工智能生成的,而且我们必须以某种方式披露它,因为不然你怎么区分现实?

Lex Fridman : 是的,你说了许多有趣的事情。首先,回顾最近的这段历史,现在感觉像是遥远的往事,与谷歌大脑有关。我的意思是,那是在TensorFlow之前。在TensorFlow公开并开源之前。因此,工具也很重要,再加上GitHub共享代码的能力。然后,你有了注意力机制Transformer和现在的扩散模型的想法,接下来可能还会有一个事后看来很简单,但会改变一切的新想法。那可能就是后训练和推理时间的创新。我认为Shad CN发推特说,谷歌距离完全赢得人工智能竞赛只差一个优秀的UI。意思是,UI是其中非常重要的一部分。这种智能如何...我认为洛根·库珀特里克现在喜欢谈论这个问题,它是一个LLM,但它什么时候会变成一个系统?在你谈论交付系统而不是交付特定的模型的时候。是的,这也很重要,系统如何展现自身,以及如何向世界呈现自身。这真的,真的非常重要。

Sundar Pichai : 哦,非常之是。有一些简单的用户界面创新,已经改变了世界,对吧?我绝对是这么认为的。在接下来的几年里,我们会看到更多的进步。我认为人工智能本身正处于一个自我改进的轨道上,为了用户界面本身。今天,我们正在约束这些模型。这些模型还不能完全用用户界面来向人们表达它们自身。但如果你仔细想想,我们实际上已经以这种方式限制了它们。但是考虑到这些模型能够编写代码,它们应该能够编写出最好的界面,以便随着时间的推移表达它们的想法,对吧?

Lex Fridman : 这是一个令人难以置信的想法。那么他们的应用程序接口(API)已经开放了。所以你可以创建一个非常棒的、具有代理性质的系统,持续改进你与人工智能对话的方式。但很多都取决于界面。当然,还有谷歌一直在推动的令人难以置信的多模态界面。

Sundar Pichai : 这些模型本身就具有多模态性。它们可以轻松地从任何格式获取内容,并将其转换为任何格式。它们可以编写良好的用户界面。随着时间的推移,它们可能会更好地理解你的偏好。所以这一切都是未来的发展方向,对吧?这就回到了我们对话开始的地方。我认为未来几年将会发生巨大的演变。

Lex Fridman : 也许再问一个厨房问题。这种更加荒谬的关于P-末日(P-Doom)的概念。

Sundar Pichai







请到「今天看啥」查看全文