杂志汇个人电脑

新一代内存路在何方

作者:编/蓝色
HBM可以说是普通人接触到的第一款3D堆栈内存,它代表着未来,而DDR内存则是主流代表,下一步是DDR5内存,再加上美光、Intel主导的HMC内存,这三者以及它们的衍生品可以说是2020年之前内存/显存技术角逐天下的主角了。

HBM的出现代表着3D堆栈的新一代内存技术日趋实用化

未来几年将实现百亿亿次计算,对处理器及内存的要求都很高每次有新闻提到P C市场销量下滑,大家往往会不自觉地调侃两家公司——“Intel,你又挤牙膏了,S N B还能战三年”,还有一个想努力挤牙膏但新牙膏上市延期、只能先上PPT的AMD。五年多前的S N B处理器+4G B DDR3内存的确还能再战,但是公平地说,计算机性能实际上一直在不断增长,2011年的T O P500冠军是日本京/K计算机,性能只有8.2PFLOPS(千万亿次),内存容量141T B,2016上半年的TOP500冠军是中国的太湖之光,浮点性能93PFLOPS,内存容量1.31PB,差不多都是5年前的10倍。

五年前的高性能计算刚刚达到1亿亿次,去年太湖之光就实现了1 0亿亿次,2020年之前的目标是实现百亿亿次,也就是exaFLOPS级别,包括中国、美国、日本和欧盟在内,百亿亿次计算是世界各国都在争夺的下一个制高点,它不仅对主处理器/协处理器提出了极高的要求,支撑起如此庞大运算规模也需要在网络连接、高速内存等子系统上实现突破。

处理器方面陆续将会有Intel下一代Xeon处理器、IBM Power 9及AMD Zen,加速卡也有NVIDIA Volta、AMD Navi等,下一代内存技术则会有DDR5、HBM、HMC等,它们还会根据不同应用范围衍生出多个版本。这次我们就来探讨一下未来的集中内存(也包括显存)技术的走向及特点。

从Haswell-E处理器开始,内存就开始从DDR3向DDR4升级,经过2年多时间的磨合,如今,DDR4内存也可以说是白菜价了。2015年AMD推出了Fiji核心的Fury系列显卡,它使用的是HBM显存,与之前的G D D R5显存不同,H B M可以说是普通人接触到的第一款3D堆栈内存,它代表着未来,而D D R内存则是主流代表,下一步是DDR5内存,再加上美光、Intel主导的HMC内存,这三者以及它们的衍生品可以说是2020年之前内存/显存技术角逐天下的主角了。

预测DDR、HBM及HMC三强争霸的结局还太早了,要想分出胜负我们还得掂量掂量这三者在性能、功耗及成本上的表现。

DDR5:内存正统续作

2014 年 , 随 着Hasewll-E处理器及X99主板的问世,DDR4内存首次进入桌面市场,不过X99平台是面向发烧级玩家的。到了2015年,Intel又推出了Skylake处理器,这才算是真正走入主流市场。经过这两年的发展,DDR4内存已经从王谢堂前飞入寻常百姓家了,其性价比完全不输DDR3内存。

对于DDR4内存,我们之前在三位一体升级换代,Haswell-E、X99及DDR4前瞻一文中已经详细解析过它与DDR3内存的不同,简单来说就是在基础频率无法大幅提升的情况下,DDR4通过翻倍提升显存核心的Bank(内存库)数量变相提高了数据吞吐率,其数据频率可从前代的0.8-2.1Gbps大幅提升到1.6-3.2Gbps,进而提高了内存带宽。

此外,D D R4内存的电压也从前代的1.5V降低到了1.2V,提高了能效,而随着工艺的进步,DDR4内存的核心容量也从之前4G b提升到了8G b、16G b,可以轻松实现单条64GB以及128GB内存,这些都是它比DDR3内存先进的地方。

目前,高频D D R4内存频率已经达到了4.26Gbps,差不多又到了一个极限了,下一步该准备DDR4的继任者了,不出意外的话,其命名就是DDR5,技术路线也类似DDR3到DDR4那样,核心频率同样不会有大幅提高,能做文章的地方还是数据预取位宽、内存库数量等。

DDR5内存目前还在研发阶段,尚未有具体规范,所以厂商公布的很多规格都不是确定的,其目标是相比DDR4内存至少带宽翻倍、容量更大,同时更加节能。具体来说就是数据频率从目前1.6-3.2Gbps的水平提升到3.2-6.4Gbps,预取位宽从8bit翻倍到16bit,内存库提升到16-32个。至于电压,DDR4电压已经降至1.2v,DDR5有望降至1.1v或者更低。

内存/显存技术路线图

DDR4内存已经是主流,下一代DDR5内存

DDR5/HBM/HMC内存及显存规范简介

DDR4内存在核心频率变化不大的情况下大幅提升了带宽

三星公布的DDR5规范与美光的略有不同

DDR5内存数据频率再次翻倍,带宽至少也会翻倍在三星讨论的DDR5内存规范中,其目标跟美光基本一致,也是带宽至少翻倍,预取位宽也会翻倍,不过内存库数量还是16个,与美光公布的数据略有不同。

而在时间点上,业界还是有一定共识的——DDR5预计在2017年完成规范制定,2018年推出样品,2019年开始生产,不过要普及的话估计至少是2020年的事了。

此外,尽管美光、三星都没提制程工艺的问题,但考虑到2018年10n m工艺已经量产了,2020年左右则是7nm节点了,而目前DDR4最先进的工艺是18nm,到了2020年那个时间段,内存也会转向10nm以下节点的。

DDR5内存衍生版之GDDR6显存

说DDR5内存是最正统的内存续作,不仅因为它是最主流的内存选择,还与它的衍生版有关——显存用的下一代GDDR与手机、平板用的LPDDR低功耗内存都跟D D R5息息相关,业界在讨论D D R5内存的同时,同样也没忘了GDDR6及未来的LPDDR5内存。

其实,很久之前显卡用的显存是跟PC内存一样的,但随着GPU性能的不断提升,对带宽的要求也水涨船高,普通P C内存已经无法满足带宽需求了。在D D R内存的基础上就衍生出了GDDR内存,GDDR5就是在DDR3基础上衍生的,两者的大部分规格都基本相同,只不过数据预取位宽从4b i t翻倍到8bit,所以GDDR5的带宽在DDR3基础上提高了一倍,这也是其数据频率是真实频率4倍的由来,而普通DDR3内存是2倍真实频率。

在DDR5基础上衍生出来的显存就是GDDR6(虽然还未正式命名)了,它的实际频率与目前高频GDDR5内存差不多,都是1.75G H z左右,但因为预取位宽再次翻倍,数据频率则会从7Gbps提升到14Gbps以上,这个思路其实跟美光主推的GDDR5X显存是一样的,同样是在不提高实际频率的情况下通过提升预取位宽实现带宽提升。GDDR6显存路线图

低功耗LPDDR5内存

当然,为了进一步降低功耗,GDDR6显存的电压也会从目前1.5V降至1.35V。

DDR5内存衍生版之LP5显存

低功耗LPDDR内存也会在DDR5基础上继续演进,其速率可达到6.4Gbps左右,而电压则会进一步降低,目前LPDDR4已经是1.1v电压了,LPDDR5的电压会低于1.1v,目标是实现20%的能效提升。

HBM:第三代性能更强大

2015年AMD推出了Fiji核心的Fury系列显卡,虽然推出的三款显卡都是面向高端市场的,售价比较高,但从技术上来说Fury系列显卡绝对是显卡史上的一次重大变革,因为它用上了HBM显存,它不仅仅是性能更强大,最重要的是HBM显存极大地减少了P C B面积占用,可以把高端显卡做得非常小巧。从某种程度上来说,AMD的R9 Nano显卡是当时让我们印象最深刻的产品,比GTX Titan X和GTX 980 Ti更有意义。

对于HBM显存,我们之前在评测及解析中也详细说过它的特点和优势了,在此就不再赘述了,感兴趣的读者可以参考以前的相关文章。总的来说,HBM的性能远超G D D R5,它的功耗降50%,面积小94%,一句话总结就是HBM在电压只有1.2V的情况下将显存带宽提升到512GB/s,性能更强、功耗更低,且占用空间更小。

到了2016年,HBM显存又进化到了第二代,并正式成为JEDEC标准。与前代产品相比,HBM 2显存核心容量从2Gb提升到8Gb,数据频率从1Gbps提升到2Gbps,带来的好处就是在同样4-hi堆栈下,HBM 2单颗显存容量可达4GB,带宽1024GB/s。Fury显卡上的HBM显存堪称一次革命一代HBM显存就比GDDR5有了明显优势

HBM 3显存也在路上了HBM显存最早是由AMD和SK Hynix联合研发的,第一代H B M显存主要是SK Hynix在生产,进入HBM 2时代,NVIDIA、三星也参与进来了,前者首发了HBM 2显存的Tesla P100加速卡。同时,SK Hynix也开始量产HBM 2显存,有2-h i、4-h i、8-h i三种堆栈方式,速率1.0、1.6及2.0G b p s,带宽分别是128、204、256GB/s,堆栈容量2、4、8GB,最高可实现32G B堆栈总容量,1024G B/s带宽。

HBM 2还没上市,三星已经开始讨论HBM 3显存了,预计在2019-2020年问世,不过,目前并没有确切的规格。从三星的表态来看,HBM 3会进一步提高堆栈层数、核心容量及带宽,但在核心频率、内存库、DQ位宽方面保持HBM 2的水平,但就算提升容量和堆栈层数,也足够HBM 3容量翻倍、带宽翻倍了,64GB HBM 3容量应该不是梦。

值得注意的是,HBM 3显存的电压预计会比目前1.2v低得多,这有助于大幅降低HBM 3功耗。

从HBM显存问世开始,我们就知道它是个好东西,各方面完胜GDDR显存——除了成本太高,因为HBM显存是新标准,产能不足,而且它是2.5D堆栈的,制造工艺比GDDR5显存复杂多了,这都加剧了HBM显存的普及难度。

在这方面,三星一边推进更高性能的HBM 3,同时也在探讨研发低成本的HBM,通过移除ECC校验、缓冲器层、减少I/O及降低TSV数量(TSV工艺中打孔数量越多,性能越好,但会更复杂),这些手段有助于减少HBM成本,虽然这会对HBM性能造成一定影响,I/O位宽从1024bit减少到512b i t,但可以通过其他手段弥补,比如提高数据频率到3Gbps,这样一来低成本HBM的带宽会从256GB/s降低到200GB/ s左右,还在可接受范围内,而制造成本就低多了。

对HBM来说,阻碍它普及的最大障碍就是成本了,一旦低成本HBM得以实现,那么HBM就有可能不再局限于高端显卡之中,CPU也可以拿它来做缓存了。

HMC:不同于HBM的3D内存

如同闪存从2D NAND转向3D NAND一样,内存也要从平面转向3D立体,前面的HBM就是3D内存技术的一种,不过它并非唯一选择,美光、Intel还有HMC(Hybrid Memory Cube)内存,它也是通过TSV硅穿孔工艺堆栈多层DRAM核心以实现3D堆栈的。

实现3D堆栈之后,HMC也可以搭积木一样堆叠内存核心了,带来的优势就是:

低成本HBM显存也在讨论中

HBM 3显存也在路上了

SK Hynix目前生产的HBM显存类型及规格

多层DRAM核心实现3D堆栈 ·性能更强,带宽是DDR3内存的15倍

·功耗更低,功耗比DDR4减少70%

·占用面积更小,比DDR4减少90%

·设计更简单,通道复杂性比DDR4减少88%

H M C与H B M都是T S V工艺的堆栈内存,很容易混淆,不过具体结构上HMC内存与H B M还是有很大不同的,它可以分为三个层次——顶部的是堆栈的D R A M核心,中间有个逻辑层(Logic Layer),最下面则是封装层(Package)。

另外,H M C与处理器的连接方式也有所不同,HBM有个工艺复杂的中介层,打通了处理器与H B M芯片,而H M C与处理器连接是靠4条高速Link,每条L i n k有16个通道,速度最高可达30G b p s,典型速度有10Gbps、15Gbps、25Gbps。如果是4-link、10Gbps速度,那么带宽可达160GB/s,15Gbps速度则是240GB/s,美光还在开发8-linkHMC,理论带宽可上320GB/s。

美光目前量产的HMC单颗容量2GB,核心容量为4G b,4层堆栈,带宽160G B/ s,算起来性能比H B M 2显存的256G B/s要差一些,不过H M C对比H B M还有个优势,那就是H B M的高带宽需要离处理器很近,显卡跟H B M都是封装在一起的,所以制造工艺复杂,成本太高,而H M C通过L i n k与处理器相连,既可以做近场内存(Near Memory),也可以距离远点(Far Memory),部署更加灵活。

不过,与H B M显存受到显卡、FPGA追捧不同,HMC推广的力度就小多了,尽管HMC阵营也有三星、SK Hynix参与,但真正在推进的只有美光、Intel,Intel代号“Knights Landing”的Xeon Phi上使用了16GB片上缓存,就是美光提供的HMC,号称是DDR4内存的5倍性能、5倍能效,同时面积占用只有后者1/3。

美光主导的HMC内存

这张图中可以看到HBM与HMC结构上的不同HMC的规范发展已经到了2.0时代,据说美光今年还要推出HMC 3.0规范,Link数量、堆栈层数、核心容量都有进一步提高,带宽可提升到480G B/s,该指标跟HBM 3差不多同级了。

美光HMC样品

美光HMC内存主要特点

小结

本文主要介绍了2020年之前新一代内存/显存的技术路线,DDR5内存的发展是按部就班,DDR5技术使用传统思路提升带宽、降低能耗,而H B M及H M C则是3D堆栈,发展潜力比D D R5更诱人,不过3D堆栈目前制造过程复杂,成本太高,主要用于高性能计算领域,普通消费者要想用上廉价3D内存/显存恐怕还要等待技术逐步成熟之后。

 

电竞新风尚

极速体验

PARROT MAMBO战斗运输机

X翼战机

Intel高端主板逐鹿战

华硕新款鹰眼手机 长焦双摄长续航拍照神器

相关文章