DDR就是双倍速率。
- 以1600MHz的内存条为例,X64的位宽,带宽就是:1600MHz*2倍速率*64bit/8/1000=3.2*8=25.6GB/s;
- 以8Channel的Intel ICX处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
- 以8Channel的AMD ROME处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
- 以1333MHz的内存条为例,X64的位宽,带宽就是:1333*2倍速率*64bit/8/1000=2.666*8=21.328GB/s;
- 以6Channel的Intel SKL处理器为例,带宽可以达到6*21.328GB/s=127.968GB/s;
GDDR可以做到四倍速率。
- 以1750MHz的内存为例,单个颗粒X64的位宽,带宽就是:1750MHz*4倍速率*64bit/8/1000=7*8=56GB/s;
- 以Nvidia Geforce GTX 1080 Ti为例,使用了11GB的GDDR5X,内存时钟是2750MHz,4倍频,内存频率是11GHz,内存位宽是X352bit,那么内存带宽为:2750MHz*4倍速率*352bit/8/1000=484GB/s;
- 以Nvidia Geforce RTX 2080 Ti为例,使用了11GB的GDDR6,内存时钟是3500MHz,4倍频,内存频率是14GHz,内存位宽是X352bit,那么内存带宽为:3500MHz*4倍速率*352bit/8/1000=616GB/s;
优点是带宽比较高,功耗比较低。
缺点是,适合并发,不适合随机访问;时序复杂,工艺要求高;不适合配合CPU的Cache line的读取。
HBM双倍速率,但是堆叠提高位宽。
2013年是HBM,2016年是HBM2
优势在堆叠,通过TSV和基底通信
每个die有2个128bit位宽的Channel
4层堆叠叫做4-Hi,带宽可以达到4*2*128=1024bit
- HBM以500MHz的内存为例,单个颗粒的带宽可达到:500Mhz*2倍频*2Channel*128bit*4Die/8/1000=1GHz*1024bit/8=128GB/s;
- HBM2时钟加倍,以500MHz的内存为例,单个颗粒的带宽可以达到2*128GB/s=256GB/s
以Nvidia Tesla V100S为例(GPU和HBM之间使用硅中介进行2.5D的封装)
应当是使用了4颗,带宽为:1107MHz*2倍频*4096bit/8/100=1113.568GB/s
HBM的优势封装比较小,堆叠设计。缺点是TSV工艺造成成本比较高。