正文
这个性能有多强大呢?对比一下谷歌的TPU v3,CS-1功耗是它的五分之一,体积只有它的三十分之一,但速度却是整个TPU v3的三倍。
搭载全世界最大芯片,几分钟完成传统芯片几个月的任务
Cerebras为CS-1设计了专门的系统和软件平台,以从史上最大芯片WSE上的40万个计算内核和18G高性能片上存储器中提取极限处理能力。
在人工智能计算中,芯片越大越好。更大的芯片处理信息更快,能在更短的时间内得到训练结果。但是,仅有优异的处理器性能还远不足够。像WSE这样的高级处理器必须与专用的软件相结合才能实现破纪录的性能。因此,Cerebras专门为这一巨型芯片开发了CS-1内置系统和软件平台,各方面都为加速人工智能计算专门设计。
Cerebras首席执行官安德鲁•费尔德曼(Andrew Feldman)在接受 VentureBeat 采访时说:“这是从300毫米晶圆中切割出的最大“正方形“。尽管我们拥有最大、最快的芯片,但我们知道,一个非凡的处理器未必足以提供非凡的性能。如果想提供非常快的性能,那么就需要构建一个系统。而且并不是说把法拉利的引擎放进大众汽车里,就能得到法拉利的性能。如果想要获得1000倍的性能提升,需要做的就是打破瓶颈。”
Cerebras首席执行官安德鲁•费尔德曼(Andrew Feldman)
Cerebras 表示,他们是唯一一家从头开始建立专用系统这一任务的公司。通过优化芯片设计、系统设计和软件的各个方面,CS-1目前的性能令人满意。
通过CS-1和配套的系统软件, AI需要几个月才能完成的工作现在可以在几分钟内完成,而需要几个星期完成的工作可以在几秒钟内迅速完成。
CS-1不仅从根本上减少了训练时间,而且还为降低延迟设立了新的标杆。对于深度神经网络,单一图像的分类可以在微秒内完成,比其他解决方案快几千倍。
“这是一台由40万个专用人工智能处理器组成的人工智能系统。”费尔德曼说。
目前,CS-1的第一台机器已经完成交付。在Argonne国家实验室,CS-1正被用于研究癌症的神经网络的开发,帮助理解和治疗创伤性脑损伤,CS-1的性能使其成为AI中最复杂问题的潜在解决方案。