正文
▲借着ARM推广64位指令集的东风,中国IC企业有了不小的发展机遇。
目前,开发ARM服务器CPU的中国IC设计公司有三家:华为、飞腾、华芯通。华芯通是我国与高通成立的合资公司,从高通手中获得了源码并基于该源码设计自己的CPU。不过,由于华芯通北京研发中心刚刚启用,正式商用产品问世尚需时日。相比之下,华为和飞腾已经有产品问世,华为的ARM服务器CPU集成了32核ARM Cortex A57,采用台积电16nm制造工艺。也许是因为华为缺乏服务器CPU设计经验,这款服务器CPU的性能相对有限。以飞腾的FT2000作参照,华为的这款服务器CPU在制造工艺领先2代的情况下,以FT2000一半的功耗实现了不足FT2000一半的性能。因此在下面文章的解析中,中国ARM服务器CPU就以目前性能最强的FT2000为代表进行说明。
在2015年的第28届国际高性能微处理器研讨会上,飞腾公布了“火星”,也就是FT2000。FT2000采用28nm工艺,主频2GHz,功耗100W。芯片面积600多平方毫米,集成了64个FTC661 CPU核,共计48亿个晶体管。根据测试,FT2000的芯片实测成绩相对于模拟器成绩要稍低一些,在2GHz主频下,采用GCC4.8编译器,SPEC2000和SPEC2006的测试成绩见表一。其中SPEC CPU2006全芯片测试分值为定点570,浮点482,单线程测试分值为定点12.4,浮点11.3,虽然在单线程性能上和Intel依旧有不小的差距,但就多线程性能而言,足以与Intel Xeon E5-2695v3芯片相媲美。
▲FTC661 CPU核架构图
▲FT-2000在SPEC CPU2006全芯片测试中的成绩
至于实测成绩和模拟器测试成绩之间的性能差距,主要是模拟环境与真实系统之间的差异造成的。首先,模拟环境中存储系统一般是用模型来构建的,与真实芯片环境相比更加理想化;其次在模拟平台上,由于模拟运行速度较慢,benchmark问题规模不能太大,都需裁剪简化。因此,真实系统测试性能与模拟环境中得到的性能不一致是正常现象。不过,这种偏差并非无法弥补,通过研究更科学的性能评估手段,可以降低模拟系统与真实系统的性能偏差。同时基于真实系统进一步开展编译调优工作,会进一步提升性能,预计测试结果会有10%~30%的优化空间。