在10月27日中科院过程所的全球Road Show中,NVIDIA首席科学家Bill Dally介绍了NVIDIA预计在2017年推出的超级计算机架构。在IT界,介绍8年之后的架构有些开空头支票的嫌疑,不过从中还是可以看出Nvidia进军通用计算市场的野心。根据Bill Dally的介绍,Nvidia未来将在一块功耗300W的芯片上集成2400个类似目前SP的throuput core,以及16个CPU。我们都知道Nvidia早晚会造CPU,但这是Nvidia首次明确的在路线图中提出要造CPU(虽然是8年之后的产品)。
2017年NVIDIA超级计算机架构
不过,黄仁勋在会上又一次强调Nvidia不会造CPU,而Bill Dally也在回答相关问题时拿Tegra当挡箭牌,有点欲盖弥彰的感觉。这种CPU+GPU芯片也印证了NVIDIA会从与Intel和AMD相反的方向实现Fusion。
每个throuput core中有三个单精度浮点单元和一个双精度浮点单元,预计这款芯片总共可以提供40T的单精度浮点处理能力和13的双精度浮点处理能力。采用这种芯片的节点还拥有128GB的内存,以及512GB的相变存储器或flash存储器作为高速本地存储器。这种节点的架构已经十分类似当今的超级计算机,而且单个节点已经能够稳进几年的超级计算机500强了。虽然从数字上看十分惊人,不过这毕竟是8年以后的产品,只要摩尔定律继续发威,基本上还是能够实现的。
有了强力的节点,对超级计算机剩下的介绍就是堆数字了:预计一个100kw机柜中可以塞进384个这种节点;而整个系统则有128个机柜组成,功耗为10MW,可以提供高达2Efplop (Exaflop, 相当于10^3 Petaflop, 或者10^6 Teraflop)的计算能力。
目前只能说,Nvidia在8年后推出的这款产品似乎很好很强大。绿巨人当然在准备Exaflop、相变存储器、异构处理器这些技术,但是他们永远不会给出一个明确的时间表,就像黄仁勋会在“某个星期二”发布GF100一样。