主要观点总结
Jeff Dean在访谈中对于AI未来的发展的观点
关键观点总结
关键观点1: AI领域的发展
Jeff Dean认为AI领域已经酝酿了很久,目前正处于一个激动人心的阶段,模型已经能够完成一些非常有趣的任务。他预测在未来一年内,我们可能会拥有相当于初级工程师水平的AI系统。
关键观点2: 智能体的应用
Jeff Dean认为智能体是一个重要的趋势,但提升智能体的能力路径是相对清晰的,需要通过更多的训练、更好的算法以及硬件的提升。他认为智能体最终可以在虚拟计算机环境中完成许多今天需要人类才能解决的任务。
关键观点3: 大模型与基础设施
Jeff Dean认为构建先进的模型需要大量投资,未来的竞争将决定于出色的算法工作以及优秀的系统硬件和基础设施成果。他认为我们尚未找到能让数十亿人每天使用的杀手级产品,但AI的应用将帮助人们完成各种任务,如管理虚拟智能体团队等。
关键观点4: 硬件与AI的关系
Jeff Dean强调了硬件在AI发展中的重要性,他认为专注于机器学习计算的硬件非常重要,并且每一代硬件都要变得更强大,通过超高速网络大规模连接在一起以满足模型的计算需求。他还提到了模拟计算在AI中的潜力。
关键观点5: AI的未来格局
Jeff Dean认为未来的AI模型将朝着更加多样化和专业化的方向发展,可能会出现一系列不同的参与者。他认为计算平台将适应新的现实,即其主要作用是运行极其强大的模型,而这些模型将在各种设备(如手机、机器人和数据中心)上运行。他还谈到了稀疏模型的前景,以及未来模型可能具有的更加有机、连续的学习系统。
正文
如今,我们可能正接近这样的转折点:对于我们这个会议室这样杂乱的环境,机器人还无法很好地适应,但我们能看到一条明确的路径,即在未来几年内,它们应该能在这样的房间里完成几十种实际工作。刚开始能完成这些任务的机器人产品肯定价格不菲。但随后通过经验学习,它们的成本会被优化,变成原来价格的十分之一,同时还能完成上千种任务。这将进一步推动成本优化和技术能力的提升。所以智能体的发展总体来讲非常激动人心。
Bill Coughran:这话没毛病,只不过现在还不能苛求太多。还有一个问题经常被提及,那就是大模型的发展现状。显然,谷歌掌握着 Gemini 2.5 Pro 还有 Deep Research 项目,OpenAI 以及其他公司也参与其中。关于开源和闭源的大语言模型数量和发展方向,业界中的讨论之声从未停止。你是怎么看的?谷歌在这一领域当然拥有强大的地位,也希望继续占据主导,但你如何看待整体格局的变化?
Jeff Dean:
我认为,构建最先进的模型需要大量投资。因此,市面上的这类模型不可能几十上百,最终留下的可能只有少数几个。一旦你拥有了这些强大模型,就可以利用诸如知识蒸馏之类的技术生成更轻量级的模型,用以适配更多场景。
我曾经是这项技术的合著者,但 2014 年 NeurIPS 拒绝了我们的论文,认为它不太可能产生影响。
我听说 DeepSeek 可能就受益于这项技术。总之这是一种非常实用的技术:当有了一个更强的模型时,你可以将其压缩成一个更小巧的模型,使其轻便、快速,且具备你想要的各种特性。因此,我认为这个领域会有许多不同的参与者,因为不同大小和用途的模型都有生存的空间。但我也相信,少数几个通用且功能强大的模型同样会表现出色。
Bill Coughran:还有个小问题。你会用“氛围编程”吗?
Jeff Dean:
我还真稍微尝试过,而且效果出奇地好。
我们在工作中有不少演示聊天室,甚至整个 Gemini 项目的沟通几乎就是在聊天室里面完成的。我加入了大约 200 个聊天室,每天早上起床刷牙时,都会收到大概 9 条通知,因为我的伦敦同事们已经开始忙活了。
我们有一段特别酷的演示:你可以上传一段教育类 YouTube 视频,然后提示词是“请根据这段视频制作一个包含图形和互动元素的教育游戏”。虽然并不总能成功,但有大约 30% 的几率,它确实能生成一些有趣的内容,比如关于微分方程、前往火星探险,或者细胞相关主题的游戏。这对于教育来说是一个巨大的信号。
我们现在拥有的工具,以及未来几年将拥有的工具,确实有机会以积极的方式改变世界。我们应该记住,这才是我们努力的方向。
观众:我很好奇你对未来搜索的看法,特别是考虑到 Chrome 的普及度如此之高。Chrome 已经掌握了支付凭证和网页签名凭证等信息。你有没有考虑过将 Gemini 直接集成到 Chrome 当中,让 Chrome 应用转化为 Gemini 应用,而不再作为单独的应用程序?我说这话,是因为我是咱们谷歌的正式员工,所以请你认真考虑再作答。
Jeff Dean:
是的,我认为核心的 Gemini 模型或其他模型可以衍生出许多有趣的下游应用。其中之一,就是让它通过观察你在浏览器或桌面电脑上的操作,帮助你完成任务,比如对标签页进行 OCR 或访问原始标签内容。
这似乎会非常有用。我们在这个领域已经有一些初步成果,并发布了视频形式的公共演示,比如 AI 助手 Mariner 等项目。具体结果尚待观察。
观众:你之前提到过,基础模型的参与者可能只会剩下少数几家,这主要是由于基础设施成本和维持前沿技术所需的投资规模过大。随着这场前沿竞争的展开,你认为事态最终会走向哪里?单纯是谁砸最多的钱、造出最大的集群就能胜出吗?还是说要更好地利用统一内存优化和现有资源,才是取胜之道?或者说最终取决于用户体验?这场军备竞赛会走向何方?是不是谁先达到天网的水平,谁就赢了?
Jeff Dean:
我认为决定胜者的,既是出色的算法工作,也离不开优秀的系统硬件和基础设施成果。不能简单认为其中一个比另一个更重要,因为在我们 Gemini 模型的代际演进过程中,我们看到算法改进的重要性与硬件改进或投入更多计算资源的重要性相当,甚至可能更高。
但从产品角度来看,这个领域目前仍处于早期阶段。我认为我们尚未找到那个能让数十亿人每天使用的杀手级产品。它可能是教育领域的某个应用,也可能是类似搜索引擎的信息检索工具,但会充分利用大型多模态模型的优势。我认为帮助人们在各自的工作环境中完成任务才是最重要的。那么,这些想法将如何转化为具体的产品形态?比如,我该如何管理一支由 50 个虚拟智能体组成的团队?它们大多数时候都会正确执行任务,但偶尔也需要咨询我的意见。我需要给予它们一定的指导。这相当于思考,我该如何管理 50 个虚拟实习生?这将是一个复杂的问题。
观众:我觉得您可能是世界上最适合回答这个问题的人选了:您认为我们离拥有一个能 24/7 全天候工作,而且水平相当于初级工程师的 AI 还有多远?