加速器模式将主导未来高性能计算
最新一期的高性能计算榜单在两天前已经发布,基于SPARC芯片的富士通系统夺得了性能第一。但在英特尔看来,未来的高性能计算将是是以加速器模式为主导的。“目前排名第一的系统的功耗已经接近4万千瓦,这相当于一个小型发电机组1/10的发电能力。如果再往百亿亿次发展的话,我们认为唯一可选的就是加速器方案,可以不停的堆叠上去。”英特尔数据中心事业部,亚太和中国区高性能计算/工作站方案架构师何万青博士在接受记者采访时说。
英特尔的观点也得到了很多在高性能计算领域的领先厂商的支持。“数据中心的能源增长空间只有10倍,采用加速器模式是未来的必然趋势。下一个十年就是集成众核+至强处理器的模式。”SGI公司的首席技术官Eng Lim Goh说,“未来的高性能计算用户都将迁移到加速器上。首先应用加速器模式的用户,将带动其他用户来应用加速器。”何万青博士进一步解释说,用户在使用加速器的时候考虑几个方面,一是需要扩大计算规模,石油、气象等用户对此有非常强烈的要求;第二,基于空间和能源的限制,包括资金也不可能无限地扩展集群,客户希望能够在有限的能源消耗下提高性能。在这两个驱动力的推动下,客户会采用加速器的模型。在ISC 2011大会上,韩国KISTI发言人表示,英特尔的集成众核架构可以实现线性增长,并在其分子动力学应用中获得了非常好的效果。
那么,什么是加速器模式?这是指在高性能计算当中,通用处理器负责数据库、操作系统等串行应用;而众核处理器则负责高性能并行计算,从而数倍、十倍、甚至百倍地提高计算效率。在最新的ISC 2011大会上,已经有7个基于英特尔众核处理器(MIC)的应用进行了实际展示。在此次展示中,英特尔集成众核处理器体现了不俗的计算能力:在1个4U机架的单节点上可以实现SGEMM 7.4TFLOP计算性能;利用集成众核Knights Ferry和至强处理器,在LU分解过程中可实现772 GFLOP的持续性能。据悉,目前的Knights Ferry采用的是300瓦设计,未来还会有225瓦的设计。
既然加速器模式是未来发展方向,那为什么要采用英特尔的集成众核架构?何万青博士表示,尽管应用加速器,但用户并不希望增加很多维护工作,代码的重新编写和移植将是非常大的开销,英特尔的集成众核架构将最大程度地解决这个问题。由于英特尔集成众核架构采用了与至强相同的编译模式,这意味着用户可以极大地降低编程负担。“现有的应用只要在至强上做充分的优化,未来的集成众核架构也同样会享受到相应的好处,用户所做的就是简单地增加一些制导语句。”目前,英特尔通过统一的一套开发工具实现了这一目标,用户只需要扩展原有的应用即可,而无需重新编写。
在此次ISC 2011大会上,英特尔还将英特尔的集成众核架构的应用进行了扩展,提供了MIC的异构集群:不但支持同构的以至强为主的开发工具,还支持单独以MIC为主的架构,现在还扩展到可以搭建一个基于MIC或者基于至强多核的集群。据悉,英特尔集成众核的下一代产品Knights Corner会在2012年面市,将采用22纳米制造工艺生产。同时,Knights Corner的计算密度将得到大幅提高,内部将有50个以上的核,并且每个核都支持多个线程,从而可以非常好地支持高度并行的数组运算、向量和矩阵计算,对气象、石油、渲染、CAD、CAE等应用有非常大的帮助。