正文
:技术原因嘛。我认为这主要归结于代码运行的优化。目前大多数代码需要在经过优化的环境中运行,而目前只有 Nvidia 的 GPU 可以做到这一点。事实上其他公司有能力开发各种技术,可能拥有长达十年的软件开发经验,但它们没有专门针对机器学习进行优化的团队。
Eric Schmidt
: 我喜欢把 CUDA 看作是 GPU 的 C 语言。这是我喜欢的理解方式。它在 2008 年诞生,我一直觉得它是个糟糕的语言,但它却成为了主流。现在有一整套开源库,它们都是针对 CUDA 高度优化的。构建这些技术堆栈的所有人都忽略了这一点。我们称之为 vlm 技术,加上其他类似的开源库,它们都为 CUDA 做了优化。这对竞争对手来说很难复制。
以上这些意味着什么?
在接下来的一年里,你会看到更大规模的上下文窗口、Agent 和 Text-to-Action 的功能。当它们被大规模应用时,影响将比我们现在看到的社交媒体带来的巨大冲击还要大,至少在我看来是这样。在上下文窗口里,你可以把它当作短期记忆来用,规模能做得这么大,这太让人震惊,技术上服务和计算是非常复杂的。
短期记忆的有趣之处在于,让它读 20 本书,把这些书的文本输入进去作为查询,让它告诉你书的内容。人类大脑会忘记中间的部分。现在有一些人在构建基本的 LLM Agent。它们的工作方式是,比如读化学类的内容,发现其中的化学原理,然后进行测试,再把结果加入到它们的理解中。这非常强大。
第三点,就是我提到的文本到动作。举个例子,政府现在正在考虑禁止 TikTok。我们不知道会不会真的发生。如果 TikTok 被禁了,我建议你们对你们的 LLM 说:复制一个 TikTok,获取所有用户,获取所有音乐,加入我的偏好,30 秒内生成并发布。如果一个小时内没火,那就换个类似的做法,这就是命令。砰砰砰,马上就成了。
你明白吗?如果你能从任意语言直接生成任意的数字指令,这基本上就是这个场景下 Python 的作用。想象一下,每个人都有一个能按你要求工作的程序员,而不再是那些为我工作,但不听话的程序员。(笑)程序员们都知道我在说什么。想象一下,一个不自大的程序员,真正按你的要求去做,还不用付那么多钱。而且这些程序员是无限供应的。而这些……
主持人
:都会在未来一两年内实现。
Eric Schmidt
:很快就会实现。我非常相信它们会在下一波技术浪潮中发生。
听众:你提到扩展上下文窗口、代理和 Text-to-Action 的结合将带来难以想象的影响。首先,为什么这些结合很重要?其次,我知道你无法预知未来,但你为什么认为这会超出我们目前的想象?
Eric Schmidt
:我认为主要是因为扩展上下文窗口能够解决时效性的问题。当前的 AI 模型大约需要一年时间来训练,包括 6 个月准备,6 个月训练和 6 个月微调,所以它们总是有点滞后。但扩展后的上下文窗口可以让你输入最新的信息,这样的上下文功能非常强大,就像谷歌那样能够实时更新。
关于 Agents 模型,我举个例子。我建了一个基金会,资助了一个非营利组织,他们启动了一个项目,有一个叫做 Chemcrow 的工具,它是基于大语言模型的系统,用来学习化学知识。他们用这个系统生成蛋白质方面的化学假设,然后实验室会在晚上做测试,系统再继续学习。这极大加快了化学和材料科学领域的研究进展。
我认为「Text-to-Action」可以理解为大量廉价程序员带来的效果。不过我觉得我们还没有真正理解,当每个人都有一个自己的程序员的时候会发生什么,他们做的是你的专长,不是简单的开关灯那样的事。
你可以设想一个场景,比如你不喜欢 Google。就说,帮我造一个 Google 的竞争对手,搜索网页、搭建界面、加入生成式 AI,30 秒内做好,我们来看看效果。这些老牌公司,比如 Google,就很可能会受到这种攻击的威胁,我们等着看。
02
「我已经不是 Google 员工了」
主持人
:你在 Google 工作了很多年,他们发明了 Transformer 架构,Peter(Peter Norvig,前 Google Research 的工程总监)是主导者之一。感谢像 Peter 和 Jeff Dean 这样的聪明人。不过现在,Google 似乎已经在主动权上失去了优势,OpenAI 已经赶上来了。我看到的最新排名中,Anthropic 的 Claude 排在了前面。我问过 Sundar(桑达尔·皮查伊),他没有给我一个明确的回答。也许你有一个更清晰或客观的解释,说说那里到底发生了什么。
Eric Schmidt
:我已经不是 Google 的员工了。坦率地说,Google 更加注重工作与生活的平衡,早早下班和居家办公,似乎比打胜仗更重要。
初创公司的成功秘诀就在于员工拼命工作
。我很抱歉,说得这么直接,但事实就是如此。如果你们毕业后创办公司,你们不会让员工每周只来公司一天,大部分时间在家工作。如果想和其他初创公司竞争,这样做是行不通的。
主持人
:Google 早期的情况和当时的微软很像……
Eric Schmidt
:是的。
在我们这个行业,有一种常见的现象:
一些公司以非常创新的方式赢得市场,彻底主导了一个领域,但却无法顺利过渡到下一个阶段
。
这种情况有很多。我认为创始人很重要,这是非常重要的问题,他们掌舵公司。虽然创始人往往难以相处,对员工要求苛刻,但他们也推动了公司向前发展。
尽管我们可能不喜欢 Elon(马斯克)的一些个人行为,但看看他在工作上做了什么。我和他共进晚餐那天,他一直在来回飞行。我当时在蒙大拿,而他那天晚上十点还要飞去参加凌晨与 xAI 的会议。
我去台湾的时候,感受到不同的地方有不同的文化,我印象深刻的是,台积电(TSMC)有一个规定,新入职的物理学博士要先在工厂地下室工作。你能想象让美国的博士去做这种工作吗?几乎不可能。
工作结果是不同的。我之所以对工作的问题如此苛刻,是因为这些系统存在网络效应。时间非常关键,而在大多数行业中,时间并不那么重要,他们有足够的时间。可口可乐和百事可乐会一直存在,两者的竞争也会持续下去,像冰川一样缓慢变化。
当我与电信公司合作时,一般的电信合同需要 18 个月才能签署。我觉得没必要这么久,事情应该尽快完成。我们现在正处在增长和收益的高峰期,这时候还需要一些疯狂的想法。
比如微软决定与 OpenAI 合作时,我当时觉得那是最愚蠢的想法之一。
微软把 AI 领导权交给了 OpenAI 和 Sam 的团队,这简直不可思议。
然而今天,他们正逐步成为最有价值的公司之一,与苹果的竞争不相上下。苹果在 AI 方面没有好的解决方案,看起来微软的策略奏效了。
03
模型的差距正在拉大
Eric Schmidt
:你刚才问,接下来会发生什么,每隔六个月,我的想法都会有所摇摆。我们现在处于一个奇偶震荡的周期波动中。就目前来看,前沿模型之间的差距——现在只有三种模型——和其他模型之间的差距似乎在拉大。六个月前,我还认为差距在缩小,所以我投了很多钱给一些小公司,不过现在我不那么确定了。
我开始和大公司谈,大公司告诉我,
他们需要 100 亿、200 亿、500 亿,甚至 1000 亿资金。