步步紧逼!英特尔至强E7 v3对决IBM POWER8
在高端关键服务器领域(4插槽或以上级别),自从IBM出售了其x86服务器业务之后,与英特尔决绝交锋的意味也就更加明显了,而2015年5月6日正式发布的至强E7 v3处理器家庭,无疑是这场交锋中最新的入局者。
有关高端服务器发展的必要性,我想在此已无需多言。虽然Scale-Out的架构获得了广泛的认同,但不得不承认,在某些应用场景下,Scale-Up系统仍然有其存在的必要性。当越来越多的应用和数据在云时代不断向后台集中时,对于当前很多关键业务,尤其是对响应速度、准确性、关联复杂度有较高要求的负载,是否真的是廉价的双路服务器配以Scale-Out架构就能搞定的呢?显然不是,这就好比HPC(高性能计算)领域中的OpenMP(单系统)与MPI(集群)架构之分,理论上讲机器内部的通讯速度与响应时间永远要好于分布式的互联,这种本质上的区别也预示着单靠其中一种架构都不可能独霸天下。事实上,也正是因为信息处理量的急剧提升,也让关键业务服务器在大规模即时数据分析与在线交易等应用中的地位更加突显。
也正是基于这样的应用需求,英特尔与IBM都不会放弃这一市场,反而会不断的对这一级别的服务器进行创新、变革。而最终的交锋对象就是E7与POWER8(在主流的应用服务器市场,IBM也希望用POWER来对抗英特尔至强E5,但这不在本文的讨论范围)。
在去年4月,笔者就当时发布的E7 v2进行了性能分析,可以看出E7的性能有了明显的进步,在与POWER8的竞争中,已经有了比肩的可能,而时隔一年之后,E7 v2的接班人的表现又会怎样呢?今天我们就来看一看!
至强E7 v3的主要改进和规格提升
步步紧逼!英特尔至强E7 v3对决IBM POWER8
E7 v3相对于E7 v2的提升之处(图中蓝色字部分)
步步紧逼!英特尔至强E7 v3对决IBM POWER8
相对于E7 v2,E7 v3重点提升部分的优势说明,这里有必要提醒大家关注一下TSX(Transactional Synchronization Extensions),在我看来,这是其最主要的功能性改进之一
E7 v3属于英特尔TOCK级的产品线,即核心架构进行了较大的改良,代号Haswell-EX,而E7 v2则是TICK级产品(代号IvyBridge-EX)。相较E7 v2,E7 v3的主要提升在于:
l 处理器核心数量从15个提高到18个
l 支持第二代AVX指令集,双精度浮点处理性能提升一倍
l QPI速率从8GT/s提升到了9.6GT/s
l 支持DDR4内存,最高速率1866MT/s
l 内存缓冲速率从2667MT/s提升至3200MT/s
l 新一代RAS(可靠性、可用性与可维护性)设计:第二代MCA架构(eMCA 2.0)/多列内存备用/DDR4地址与命令信号校验与恢复/关键内存区镜像等
l 一些核心与电源管理的增强设计(如虚拟化方面的支持)。
步步紧逼!英特尔至强E7 v3对决IBM POWER8E7 v3不再有面向双插槽系统的2800系列,而且4800与8800系列也进行了结合,按照一个统一的“系统平台空间”(基础-标准-高级,而非严格按照插槽数量)进行型号的划分,也因此相较E7 v3,主流型号(SKU)少了一半,同时新增加了4款面向HPC(高性能计算)的型号
步步紧逼!英特尔至强E7 v3对决IBM POWER8
E7 v3家族所有成员规格列表
有关于E7 v3非常细节的技术设计(比如崭新的内部双环互联架构),并不是本文的重点,有兴趣的读者可以自行找资料深入了解。不过有一点我觉得有必要重点说一下,那就是TSX,即交易同步扩展指令集(Transactional Synchronization Extensions)。
其实,TSX本来就是Haswell的一个新能力,但发布之后即发现了Bug,所以立刻在芯片内部禁用,至强E5v3亦受到此影响而取消了这一功能,如今这一问题在E7 v3上得以修复,正式投入使用。
TSX的目标是针对传统“内存锁”的,所谓的内存锁,是一种防止不同线程操作相同内存区域的机制,以防止数据发生同步问题,这一点在交易处理中非常重要。在实际的应用中,单一时间段里,内存锁赋予单一线程锁定内存的能力,在这一状态下,其他线程不可以访问相应的内存数据,即使是读取也不可以,所以在并行处理中,其他线程要等到内存锁才能获得内存访问的权限,显然这个设计对于线程关联较为紧密的应用效率是有很大阻碍的。而TSX则打破了这种传统的束缚,可以让软件在开发者不用再担心如何利用内存锁,而应用的实际效率也获得了明显提升。我个人认为,TSX可算是E7 v3带给应用开发者最大的礼物,在某种程度上讲,它所带来的性能收益要远高于硬件规格本身的提升。
步步紧逼!英特尔至强E7 v3对决IBM POWER8
英特尔TSX的说明,分为硬件锁省略(HLE,Hardware Lock Elision)和受限事务内存(RTM,Restricted Transactional M