专栏名称: EETOP
EETOP电子网(中国电子顶级开发网)是国内最顶级的电子行业工程师社区,涉及:嵌入式、智能硬件、半导体集成电路设计及制造等。 为您分享论坛精华内容、行业最新资讯、产品及技术 。 网址:www.eetop.cn bbs.eetop.cn
目录
相关文章推荐
51好读  ›  专栏  ›  EETOP

一夜回到解放前--掀起“NVDLA”的盖头来(Nvidia刚发布的NVDLA是何方神圣?)

EETOP  · 公众号  · 硬件  · 2017-09-29 12:51

正文

请到「今天看啥」查看全文


NVDLA是NVIDIA Deep Learning Accelerator的简称(瞎猜的),由NVIDIA公司在2017年9月26日正式发布在github上(https://github.com/nvdla),关于NVDLA的文档可以在NVDLA的官方网站(http://nvdla.org)找到。目前,文档可分为两部分,粗略的介绍可直接看http://nvdla.org/primer.html,跟架构相关的较详细的介绍可参考http://nvdla.org/contents.html,本文中主要信息也是从以上两个文档而来。

NVDLA的PPA如何?

2.1 performance

首先是Performance方面的数据:

需要注意的是以上数据是针对某个配置下的性能数据,毕竟NVDLA是“变形金刚”,如果不给定configuration,单独给出的性能数据是不可信的。

2.2 Power

很遗憾,目前还没有NVDLA相关的Power数据,不过据官方人士介绍,NVDLA是从他们内部项目实际使用的版本进化(阉割)而来,功耗估计不会像一般的开源项目那样太离谱。

2.3 area

最后是面积相关的数据:

注:以上面积数据不包括onchip memory,毕竟4MB的on chip memory对于嵌入式场景来说实在是太奢侈了。

三、掀起盖头来,NVDLA有哪些值得关注的亮点

3.1 变形金刚

毫无疑问,掀起盖头之后,首先映入眼帘的无疑就是其‘多变’的特性,从低端到高端,用户可以根据PPA自行trade-off,得到适合自己的NVDLA版本。在我看来“多变”实属无奈,谁让这世界变化快。在深度学习算法日新月异的状态下,不具备“多变”的属性估计也活不了多久。

3.2 专款专用

对于Deep Learning中的不同layer,NVDLA基本都有与之对应的、相互独立的硬件模块。各模块之间均可单独决定“去留”。这和我们在进行硬件架构时追求的“尽量让运算单元复用”的思想是完全不同的。

NVDLA的整体架构如下:







请到「今天看啥」查看全文