主要观点总结
本文介绍了特斯拉的超级计算机Dojo的背景、作用、发展历程以及意义。Dojo是特斯拉为了训练其人工智能模型而打造的一台超级计算机,它将有助于特斯拉实现完全自动驾驶,并将机器人出租车推向市场。文章还提到了特斯拉Dojo超级计算机的一些关键信息,如Dojo的芯片、规模以及进展情况。
关键观点总结
关键观点1: 特斯拉的Dojo超级计算机的目的是为了训练其人工智能模型,特别是完全自动驾驶系统。
Dojo采用了定制芯片D1,并由数百个这样的芯片组成,以提供强大的计算能力和带宽。
关键观点2: 特斯拉的Dojo超级计算机对特斯拉的长期战略非常重要,它有助于特斯拉实现完全自动驾驶,并将机器人出租车推向市场。
特斯拉正在努力摆脱对英伟达芯片的依赖,并正在开发自己的芯片,以实现更高的算力和更低成本。
关键观点3: 特斯拉的Dojo超级计算机已经取得了一些进展,但还需要更多的时间和努力来完全实现其潜力。
未来,特斯拉可能会将其Dojo超级计算机出租给其他人,以获取更多的收入。Dojo的潜在价值被认为可能增加特斯拉的市值数千亿美元。
正文
特斯拉的“完全自动驾驶”系统目前售价为 8000 美元(约 57124 元人民币),最高为 15000 美元(约为 107108 元人民币),已有约 180 万人付费。该公司称,最终将通过无线更新把用 Dojo 训练出来的人工智能软件推送给特斯拉客户。其巨大的用户规模还意味着该公司能收集到数百万公里的视频记录,这可用于训练完全自动驾驶系统。特斯拉公司的想法是,收集的数据越多,该公司就离实现完全自动驾驶越近。
但是,一些行业专家认为,用更多数据来投喂模型并期望它变得更智能,这种蛮力方法可能是有局限的。
“首先是经济上的限制,很快,这样做的成本就会变得过高,”普渡大学硅谷电气与计算机工程教授阿南德·拉古纳坦说。此外,他还说:“一些人宣称,训练模型可能真的会耗尽所有意义的数据。更多的数据并不一定意味着更多的有用信息,所以这取决于这些数据中有多少信息对创建更好的模型有用,以及这些信息能否在训练过程中真正转化成更好的模型。”
拉古纳坦认为,虽然有这些疑虑存在,但至少在短期内,增加数据量的趋势似乎不会停止。增加数据量来训练特斯拉的人工智能模型,就意味着需要更多的算力来存储和处理所有这些数据。这就是超级计算机 Dojo 的用武之地。
参考图片:美国橡树岭国家实验室的百亿亿次级 HPE Cray EX 超级计算机。
(图源:OLCF at ORNL, CC BY 2.0, via Wikimedia Commons)
特斯拉的 Dojo 是一台超级计算机系统,主要用来训练其人工智能(特别是完全自动驾驶系统)。Dojo 这个名字是对用来练习武术的道场(或武馆)的致敬。
超级计算机由数千台被称为节点的小型计算机组成。每个节点都有自己的中央处理器(CPU)和图形处理器(GPU)。CPU 负责所有节点的统筹管理,GPU 则承担更复杂的任务,比如将任务拆解为多个部分然后同时处理它们(称为并行处理)。对于机器学习操作来说 GPU 至关重要,比如那些在模拟环境中支持完全自动驾驶训练的操作。它们还是大型语言模型必不可少的硬件,所以生成式人工智能的兴起将英伟达推上了全球最有价值公司的宝座。
当然特斯拉也购买了英伟达的 GPU 来训练它的人工智能(稍后会详细介绍)。
马斯克在 X 发帖展示 Dojo 的照片,并称“到今年年底,Dojo 1 将提供大约与 8000 个 H100 等量级的在线训练。“规模不算大,但也不小。”
(图源:Elon Musk on X)
主要原因是特斯拉采用的纯视觉方法。完全自动驾驶系统背后的神经网络是在大量驾驶数据的基础上训练出来的,用于识别和分类车辆周围的物体和环境,最终做出驾驶决策。这意味着,当启用完全自动驾驶系统时,神经网络必须以与人类的深度和速度识别能力相当的速度,不间断地收集和处理视觉数据。
也就是说,特斯拉想要创造人类视觉皮层和大脑功能的数字克隆。
为了达到这个目标,特斯拉需要存储和处理从全球汽车上收集的所有视频数据,并运行数百万次模拟来基于这些数据训练其模型。
目前,特斯拉似乎依赖英伟达的 GPU 来为其的 Dojo 训练计算机提供动力,但它并不想把所有鸡蛋都放在一个篮子里——特别是因为英伟达的芯片价格高昂。特斯拉还希望打造出更好的产品,增加带宽、减少延迟。这就是特斯拉的人工智能部门决定推出自己的定制硬件程序的原因,它希望能比传统系统更高效地训练其人工智能模型。