二进位的世界:记忆体发展简史 - DDR4 VS DDR3


2020-05-22


特别企划
  • 二进位的世界:记忆体发展简史 / DDR4 VS. DDR3 效能评测

    无论是个人电脑,或是今日最夯最潮的手持式智慧行动装置,记忆体都是不可或缺的一项重要元件。随着科技的日新月异、及製程与良率的提昇,记忆体效能有着让人眼睛为之一亮的成长。

    经历过群雄併起的竞争与整併,目前记忆体颗粒大厂已是屈指可数,相较于十年前晶圆、颗粒的洛阳纸贵,今日模组在价格上的亲民化与平价化,对于个人电脑的普及更是有着功不可没的贡献。

    除此之外,记忆体技术各领域的应用,诸如:数位相机、随身碟、手机等,皆对人类文明的发展,有着更上一层楼的突破。因此,笔者这次便浅谈记忆体的发展史及其相关运用,希望大家能够有一个基本而简单的了解。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    0与1、开与关

    现行主流的电脑系统里,运算作业一直都是二进位的世界。那幺,为何人类在日常生活中,大多时候都使用十进位,为什幺电脑却要设计成二进位呢?这是由于0与1两种资料讯号,刚好可以对应物理材料的「开」与「关」,使得实体世界与作业系统的运算空间,有了一道衔接的桥樑。

    西元1958年对电脑来说是一个转捩点,基尔比与诺义斯两人创作出积体电路,将原本体积庞大、笨重的继电器电路,转化成模组化微晶片模式,透过积体电路上电流的通过与否,这两种相反的状态来表示0与1,也就是不通电代表0,而通电代表1。自此,每一条电路,都可以记录成0与1两种状态变化(Binary Digit),而摘自Binary的B结合Digit的it,我们就定义命名积体电路工作时的数据资料为Bit,也就是今天众人耳熟能详的位元。
    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 积体电路是一种把电路,主要包括半导体装置,被动元件等小型化的方法,将电路映射在半导体晶片表面上的积体电路,又称薄膜(thin-film)积体电路。由独立半导体装置和被动元件,整合到基板或线路板所构成的小型化电路,称之为厚膜(thick-film)积体电路。

    二进位的大千世界

    前文提到,在数位资料的组成当中,最小单位是位元(bit),每个位元即代表0或1,对应到实体元件上,即为开与关;自此,硬体世界里的开与关,和软体园地里的0与1,两者之间开始有了一个完美的映射关係(Mapping)。

    如果我们把位元想像成电灯,那幺一个电灯的开与关,可用(0,1)作为描述符号;但如果要让以无数电路组成的电脑,模拟出人类惯用的十进位数字规则(0 ~ 9),单只有一个位元是不够的,至少必需要四个位元才足够涵括。

    像0101和1001就是两种不同的变化,因此四个位元总共有24种组合,也就是有0 ~ 15共计十六种变化。虽说四个位元已经超过了十进位中0到9,总计十种字元的需求,但科学家却也因此顺水推舟,发展出一套十六进位的系统,将每个位元善加利用。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 四种主流进位制的等价关係表,稍懂原理即可轻鬆换算,以十六进位常见的FFFF为例,即为十进位世界里的65535。

    八位元 位元组

    在十进位的基础下,我们若想让电脑使用26个英文字母及0~9共十个阿拉伯数字,则总共需要36个符号字元,换算之下,五个位元只能涵括32个符号字元,总计至少需要六个位元,方能加以完全涵括。

    我们知道,六位元总共有六十四种变化,因此还可以表示英文字母的大写与小写与0 ~ 9十个数字。演变到最后,今日我们在键盘上所看到的各种符号字元,基本上都有一个对应的位元码,像是英文字母大写B,二进位表示即为01000010。

    如此一来,只要使用者能把某件工作转换成一个纯粹的「运算问题」,并且以键盘组合出来的语言丢给处理器计算处理,那幺电脑就可以处理所有现实生活中,你所能够以键盘组合出来的各种问题。

    而这些键盘中常用的各种符号字元接近两百五十六种,因此,很自然地我们便以八位元(2的8次方=256)当成一个组合,称之为位元组(Byte),成为资料传输的基本单位。而在记忆体内部,最小定址单位即为一个位元组。换句话说,你无法单独存取1 bit的数据或者任意小于一个位元组的资讯。

    图 / 把八个位元想成八个电灯开关,每个电灯都有开与关(0与1)两种状态,因此总共有28种组合,其中00000000是第一种状态,11111111是第两百五十六种状态,总计有256种状态。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 把八个位元想成八个电灯开关,每个电灯都有开与关(0与1)两种状态,因此总共有28种组合,其中00000000是第一种状态,11111111是第两百五十六种状态,总计有256种状态。

    GB级主流世代

    上一段提到,位元组(Byte)是电脑内最基本的传输单位,再往后则每乘以1024来增加一个单位量级,换言之,1KB(Kilo Byte)等于1024 个 Byte、1MB(Mage Byte)等于1024个KB、1GB(Giga Byte)等于1024 个 MB、1TB(Tera Byte)等于1024 个 GB、1PB(Peta Byte)等于1024 个 TB、1EB(Eksa Byte)等于1024 个 PB。

    在2015年的今天,无论是手机或是个人电脑,记忆体与处理器之间的数据传输,已经走到GB级世代。消费级主机板搭载2~8条记忆体插槽,X99晶片组最大支援至128GB,随着处理器的运算速度越来越快,传输的数据越来越多,只要记忆体储放资料的空间够大,实体位址足够应付传输数据不被塞满,那幺作业的流畅度也就会更无滞无碍。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 最新一代X99晶片组,支援DDR4记忆体,容量最大至128GB,运算传输能力更加强悍。

    「挥发性」与「非挥发性」记忆体

    除了容量之外,依据资料储存能力与电源存蓄关係,记忆体主要可以分为挥发性记忆体(Volatile memory)与非挥发性记忆体(Non-volatile memory)两大类;前者指的是当电源供应中断以后,实体位址所储存的资料便会消失的记忆体;后者即使电源供应中断,实体位址所储存的资料也不会消失,再经供电之后,便能够继续读取资料的记忆体。

    因此,从定义来看,插在主机板上的随机存取记忆体,属于挥发性记忆体;而我们主机板上的BIOS,其实就是非挥发性记忆体的一种组成系统,

    当电脑载入主要作业系统之前,BIOS(基本输入/输出系统)是各项硬体元件的基本 I/O 控制程序之集合。BIOS寄存在EEPROM (Electrically Erasable Programmable Read Only Memory︰电子式可抹除可编程唯读记忆体)上,演变到现在,多数主机板已经进化到把BIOS轫体存放于Flash ROM上,进化成UEFI(Unified Extensible Firmware Interface,统一可延伸韧体介面)。与早期PROM、EPROM相比,EEPROM、Flash ROM与UEFI具有可重複抹除覆写的特性,方便BIOS进行轫体更新昇级,同时让主机板厂与使用者双方,都得到了更大的弹性。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 到了UEFI时代,BIOS不再是以往冰冷的篮底白字红警框,除了版面更加清晰,随手一切就能发现导入了图型化设计,使得初学者也能更加快速的入门、上手。

    源自蛋糕的随身碟

    在非挥发性记忆体领域成就上,最值得一提的,莫过于现任中央研究院院士、手机四大发明者之一,同时也是前国家奈米元件实验室主任的华人之光─施敏博士。西元一九六七年,施敏博士提出记忆体浮动闸(floating gate)技术,直接促成了Flash Memory的诞生,现在我们常用的随身碟、手机、数位相机、MP3等,无处不见Flash Memory的蹤迹,而施教授创造Flash Memory的发想则来自一个有趣的灵感。

    某日午餐过后,施教授看到同事点了一块蛋糕当甜点,中间层涂了一层可口的奶油,此时大师脑中的苹果突然掉下来,想到何不在MOSFET中间加一层很薄的金属层(也就是所谓的浮动闸)。此时,只要施加电压,便可将电子导入浮动闸内并保存其中,同时更意谓着电路的导通性发生改变!这层金属浮动闸的上下两侧皆属絶缘体,因此除非再度施加反向电压,否则电子会一直保存在里面,因此与DRAM相比,拥有即使断电资料也不会消失的优点。

    这个原理和前文所述一样简单明确,金属层浮动闸内存有电子时,电路无法导通,可视为0,反之当电子冲出浮动闸时即形成电流,则视为1。自此,第一个「非挥发性记忆体」于焉诞生。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / Flash Memory主要有NOR与NAND两种;前者常见于主机板BIOS,后者常见于一般消费性电子产品,诸如︰手机、随身碟、SSD等。图为大厂OCZ Vector 150 240GB固态硬碟。

    挥发性记忆体(Volatile memory)

    王安电脑于今日已成为历史的一页,但在电脑产业萌芽初期,王安电脑研发出磁圈记忆体(Magnetic Core Memory)作为记忆体元件,这项划时代发明彻底终结了电脑的真空管时代,进一步将电脑往半导体时代推进。随后,施敏博士研发的快闪记忆体(Flash Memory)改善了磁圈记忆体巨大笨重的缺陷,有望取代磁圈记忆体的地位一跃而上。

    不过命运之神总爱开玩笑,几乎与施敏博士在同一时间,科技巨擘IBM于西元一九六七年,提出了DRAM(Dynamic random access memory,动态随机存取记忆体)技术规格,随后DRAM便在IT领域里一炮而红,而一直到二十年后,当诺基亚、易利信、摩托摩拉等手机大厂,在遍寻不着同时拥有轻薄、省电、具记忆性的通讯记忆体元件时,具备非挥发性特徵的快闪记忆体才一鸣惊人,立即迅速地被广泛地推广到各种领域,开发出不同应用层面的产品。

    DRAM与Flash Memory最大的差异在于前者一个位元只使用一个电晶体,而电晶体仅能维持几毫秒的带电状态,因此它必须不断地充电,以保持记忆体内的资料不致流失,是故这是一种挥发性记忆体(Volatile memory)。另一种不可不提的挥发性记忆体,当属SRAM(Static Random Access Memory,静态随机存取记忆体),我们在中央处理器上的Cache即可以见到SRAM的蹤迹。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 王安电脑的磁圈记忆体终结了电脑的真空管时代,曾经独领风骚一时,并进一步将电脑往半导体时代推进。(图片来源︰维基百科)

    静态随机存取记忆体(Static Random Access Memory)

    还记得今年夏天,胖达在中山大学电脑营授课时,有位同学提出了一个好问题。「既然处理器上的L1、L2 cache那幺快,为什幺电脑平台记忆体不用SRAM取代、提速就好?何必搞什幺DDR3、DDR4!」

    胖达只能说,这真是个大哉问!简单来说,SRAM和DRAM一样,都是由电晶体组成,通路代表1,断路代表0,但是SRAM 对称式的电路结构设计,使得每个记忆单元内所储存的数值,都能够以比 DRAM 还要快的速率被读取。除此之外,由于 SRAM 多数都被设计成一次读取所有的资料位元(Bit),比起DRAM在高低位址间的资料交互读取,SRAM在工作效率上快上许多。

    然而,SRAM最大的问题在于每一个储存位元需要六个电晶体;相较之下,DRAM的优势在于结构简单,每一个位元的资料都只需一个电晶体作动,因此在成本上,SRAM远比DRAM所费不赀之外,除非製程技术提昇,使得电晶体体积(Die Size)缩小,同样尺寸大小的处理器才能塞进更多的电晶体,换句话说,SRAM的容量才有办法拉高。

    因此每一世代,晶圆厂製程更加先进,处理器Cache容量也才能随之受惠、提昇。从广义来看,这就是Tick-Tock战略下的支脉延伸,是故总结而论,SRAM相对于DRAM来说,由于所需电晶体较多,因此体积也大上不少,同时成本也随之居高难下,是以在不同元件的设计取向上,两者各自发挥自我优势,互擅胜场。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 摩尔定律是指同一个尺寸相同的晶圆上,所容纳的电晶体数量,因製程技术的提升,每十八个月会加倍,但成本不变;电晶体愈多则晶片执行运算的速度愈快,当然,所需要的製程技术也愈加具有挑战性。

    动态随机存取记忆体(Dynamic random access memory,DRAM)

    DRAM之所以被称为动态随机存取记忆体,是因为必需周期性地不断充电,才能够保持资料的完整;相较Flash Memory,DRAM存取时间较长,且不具有记忆性。不过,由于製造成本低廉,且当年IBM在制定规格时,又具有一鎚定音的影响力, 因此DRAM最后在这场竞争中脱颖而出,击败了施敏博士的Flash Memory,成为了电脑系统中记忆体规格的主流。

    之后不断螁变、进化,演义迄今,为个人电脑及伺服器所广泛使用。其作用主要用以储存执行作业所须的暂时指令以及资料,使电脑的中央处理器能够更快速读取储存在记忆体的指令及资料,确保电脑能以更短的时间来执行作业,而使工作能够更迅速地完成。

    依製作方式的不同,DRAM可分为SIMM(Single In-line Memory Module,单线记忆模组),及DIMM(Dual In-line Memory Module,双线记忆模组);前者常见于早期的30 Pin或 72 Pin 的 DRAM,部份168 Pin的SDRAM亦为如此设计。SIMM特徵在于记忆体仅一面有IC与颗粒,而另一面则没有,故又被称为单面记忆体;而DIMM顾名思义则是两面皆有IC与颗粒布局其中,也是现今的主流设计。另一方面,一般在不讨论特殊规格的情况下,比较普及的记忆体的种类大致可分为以下四大种类,分别是FP RAM (Fast Page RAM)、EDO DRAM(Extend Data Out Dynamic Random Access Memory)、RDRAM(RAMBus Dynamic Random Access Memory)、以及SDRAM(Synchronous Dynamic Random Access Memory)。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 其实Intel H61晶片组的发布还是不久以前的事,但最多只能安装两条记忆体;就算是少数有四条记忆体插槽的H61主机板,也只能安装4条「单面」SIMM记忆体。这样的设计,使得当年许多DIY使用者在昇级时买错记忆体,到了7系列晶片组后,几乎所有的新产品都已取消类似设计。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 由上至下,这四种记忆体都曾是主流,现在已经是昨日黄花。其实每一种记忆体都有其可歌可泣的历史,但碍于胖达确实是一个懒人,因此无法在这篇文章里完整交待完毕,只能概述而过。

    FP RAM(Fast Page Random Access Memory)

    Fast Page DRAM,简称之为FP RAM,是被广泛运用的一种改良型DRAM,主流区分为30pin与72pin两种规格,工作电压为5V,主流容量仅有1MB和2MB两种可供消费者选择。30pin FP RAM频宽为8bit,常见于XT/AT 286、386和486电脑当中,一次至少需要安装四条;72Pin FP RAM频宽为32bit,需成对使用,常见于486电脑中,少数初期Pentium电脑也看得到72pin FP RAM的蹤迹,但并不常见。FPRAM在当读取同一列资料时,可连续传送行位址,不需再送列位址,即可读出多笔资料,虽然在当时颇为先进,但在现在看来是非常没有效率的工作方式。而FPRAM最大的问题在于时脉频颈为66 MHz,跟不上中央处理器的工作速度,因此,随着处理器的进化,FP RAM也随着成为昨日黄花,消逝在历史的洪流里。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 这是特规4MB FPRAM,奠定了今日记忆体模组的外貌原型,当年要价所费不赀,但今天只能在工业控制领域偶尔瞥见了。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    EDO RAM(Extend Data Out Dynamic Random Access Memory)

    EDO RAM採用SIMM(Single In-line Memory Module)插槽,是美光(Micron)公司的专利技术;主要有72pin 和168pin之分,工作电压为5V,频宽32bit,由于自Pentium处理器以降,资料频宽是以六十四位元运作,因此EDO RAM必需成对使用,只插单条无法运行。EDO RAM 是由传统 FPRAM (Fast Page RAM) 中演化改善而来,在早期,资料传输运作上主要假设下一次的存取地址都是与上一次连续,系统运作前準备将资料妥善定址,这样便能把记忆体资料吞吐量由前一代FPRAM 的最高 176MB/s 提升到 EDO RAM 的最高 264MB/s,因此,于1993 年后 EDO RAM 便开始取代FPRAM所扮演的角色,并常见于486及早期 Pentium 系列个人电脑,若家中还有十多年前的个人电脑,不妨可以拆开来一睹当年EDO RAM的风采。

    EDO RAM当道时期,在x86领域里Windows 95称霸作业系统,这个时期主流Pentium处理器还只有三十二条定址线、晶片组没有re-mapping技术,当然作业系统也就还没有PAE功能,这因为规格制定者,没有想到技术与製程演进速度如此之快的缘故,也因此后续还衍生出一些像是32位元作业系统有4GB记忆体容量上限等议题,但今日皆已解决、问题亦不复见。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 胖达人生第一次手动昇级的记忆体,就是图中的EDO RAM规格,容量也只有少少4MB,回想起来已经是快要20年前的事了。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 由「工作管理员」与「系统内容」页面都可以发现,测试平台32位元Win 7仅预设支援约3.5GB记忆体容量空间,就算你像图中插上6GB也无法完整抓到。

    SD RAM(Synchronous Dynamic Random Access Memory)

    当时在 Intel Celeron 系列以及 AMD K6 处理器以及相关的主机板晶片组推出后,EDO DRAM 的性能再也无法满足系统需求,记忆体技术必须彻底革新,才能满足新一代 CPU架构的需求;此时记忆体开始进入极为经典的 SD RAM 时代。

    SDRAM所插的插槽叫DIMM(Dual In-line Memory Module),因其两侧的金手指所传的资料不一样故得其名,本体虽说是168Pin,但是单面只有84Pin;又由于当时常见的笔记型电脑,其DIMM为144pin,比桌上型电脑的还短,因此又常称168Pin的DIMM为Long DIMM。

    第一代 SDRAM 记忆体工作频率为66MHz(PC66),但很快由于Intel和AMD的频率之争,将CPU外频拉高到100MHz,所以PC66记忆体很快就被PC100记忆体取代,接着133MHz外频的PIII以及K7时代于焉来临。此外,PC133规範也以相同的方式进一步提升SDRAM的整体性能,大幅将频宽提高到1GB/sec以上的理论值。由于SDRAM 为六十四位元之规範 ,正好对应处理器六十四位元的资料频宽,也因此它只需要单条记忆体便可稳定工作,方便性进一步提高。在性能方面,由于其输入输出信号保持与系统外频同步,因此速度明显超越EDO记忆体。

    不可否认的是,虽然SDRAM由早期的66MHz,发展到后来的100MHz、133MHz ,儘管没能彻底解决记忆体频宽的瓶颈问题,但在这个时期「超频」已经成为DIY用户永恆的话题,不少玩家将某些知名大厂的PC100记忆体超频到133MHz使用,为中央处理器的超频取得更大的成功及效益。值得一提的是,当时为了方便一些超频用户需求,市场上出现了一些 PC150、PC166规格记忆体。儘管PC133记忆体在当时高达 1064MB/sec已是划时代的突破,但此时 Intel已经开始着手Pentium 4的接班计划,是故PC133 SD RAM已然无法满足时代的需求,于是一场「谁是接班人」的好戏紧接而来,DDR RAM和RAMBUS的夺位大战硝烟瀰漫、一触即发。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 这是一对512MB PC133 SD RAM,刚推出时售价约两万元台币,反观今日记忆体价格,DIY玩家们实在是太幸福了。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 笔电专用的短版记忆体,常称之为SO-DIMM;现今主流DRAM SO-DIMM针脚为200Pin。图为 Apacer黑豹金品系列。

    DDR SDRAM(Double Data Rate Synchronous Dynamic Random Access Memory)

    Double Date Rate SDRAM 简称 DDR SDRAM,顾名思义也就是「双倍速率 SDRAM」的意思。DDR SDRAM可以说是SDRAM的升级版本。DDR SDRAM在时脉讯号上升端与下降端时各传输一次数据,这使得DDR SDRAM的资料传输速度为传统SDRAM的两倍, 由于只多添加了下降端讯号,因此并不会造成功耗上的增加,另一方面,在定址与控制信号部份,DDR SDRAM则与传统 SDRAM相同,仅在时脉上升端传输,为当时x86架构的相容性与速度的提昇作了最好的折衷。

    DDR可说是作为一种在性能与成本之间妥协的解决方案,其战略是迅速建立起牢固的市场空间,继而一步步在频率上高歌猛进,最终弥补记忆体频宽上的不足。

    第一代 DDR200规範并没有得到普及,第二代PC266 DDR SDRAM(133MHz时脉×2倍数据传输=266MHz频宽)是由 PC133 SDRAM记忆体所衍生出的,它将DDR记忆体带向大众市场第一个高潮,直到目前,还有少数老用户家里使用的赛扬和AMD K7处理器都採用DDR266规格的记忆体,到后来的DDR333 记忆体也只属于一种过渡规格,在数年前DDR400记忆体成为800FSB处理器搭配的基本标準,随后的 DDR533 规格,则成为超频用户的选择对象;而DDR400记忆体最后也一统江湖,成为了当时平台之主流。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 图为512MB DDR400 SDRAM,这个时期的记忆体虽然仍不便宜,但比起RDRAM的天价已算相当平实。Kingston在这个时期累积了良好的口碑,佔有率大幅提昇,今日稳居霸主地位。

    RDRAM(RAMBus Dynamic Random Access Memory)

    RDRAM採用RIMM ( Rambus In-line Memory Module) 插槽,是由RAMBus与Intel共同提出,频宽16bit,有184pin和168pin之分,工作电压为2.5V,工作频率达600、800、1066MHz,对应命名为PC600、PC800、PC1066规範。

    RDRAM相对常见于Intel PIII、P4电脑。在当时原本很有发展潜力,在规格刚发表的同时,一时之间有和DDR SDRAM一决高下,取代SD RAM的趋势;但由于製作成本过高,导致许多记忆体大厂兴趣缺缺,而不巧屋漏偏逢连夜雨,当时Intel Pentium4处理器的效能又被AMD K7阵营压着打,Intel阵营Pentium4处理器绑RAMBUS的作法,反应在零售价上,消费者也不愿买单;一时之间,零售市场纷纷转向AMD K7绑DDR SDRAM的高CP值组合,因此最终RDRAM在普及率上完败给DDR SDRAM,因此市场上并不常见。

    但值得一提的是,当年三大次世主机︰SONY的初代PS、SEGA的SS、与任天堂的N64的大战之中,任天堂为了取得主机性能上的优势,断然採用了RDRAM这项高成本的产品,而SONY因见到RDRAM相较于其他规格记忆体上的优势,在PS2主机上也使用了32MB的RD RAM。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 拆开任天堂64游戏器,可以清楚发现RDRAM的身影跃然其上。

    DDR二代目

    随着处理器性能不断提高,众人对记忆体性能的要求也愈加狂热。因此JEDEC组织很早就开始酝酿DDR2标準,加上当时Intel首先发难,宣布LGA775脚位的915/925平台开始对 DDR2记忆体的支持,于是DDR2记忆体便一路活跃记忆体领域迄今。

    DDR2能够在100MHz的频率基础上,提供至少400MB/s的频宽,同时运作电压仅1.8V,採用FBGA封装,从而进一步降低电脑运作时所产生的废热,并拉高运行频率。此外,DDR2融入CAS、OCD、ODT等新性能指标和中断指令,提升记忆体频宽的利用率。从JEDEC组织者阐述的DDR2标準来看,针对PC等市场的DDR2记忆体拥有400、533、667MHz等不同的时脉频率,最后由于全球大厂的疯狂竞争,一举将DDR2记忆体的时脉标準拉高至800,甚至可见1000MHz等更高的频率;时至今日,许多人正在使用的电脑上,主机版上正是插着DDR2 SDRAM。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 加入CAS、OCD、ODT技术规範的DDR2,相对元祖SDRAM与初代DDR,有更好的运作效率。

    DDR三代目

    DDR3 SDRAM是目前零售市场上,速度最快的记忆体种类。DDR3 SDRAM为了更省电、传输效率更快,使用了SSTL 15的传输介面,工作电压是1.5V,採用CSP、FBGA方式封装,除了延续DDR2 SDRAM的CAS、OCD、ODT、AL等控制方式外,另外新增了更为精进的CWD、Reset、ZQ、SRT、RASR技术规範。

    CWD是作为写入延迟之用,Reset提供了超省电功能的命令,可供DDR3 SDRAM记忆体,实行颗粒电路运作停止、进入超省电待命模式;新增了SRT,可程式化温度控制记忆体时脉功能,SRT的加入让记忆体颗粒在温度、时脉和电源管理上比起DDR 2有了极大的进化,可说是在记忆体内,就做了电源管理的功能,同时,更让记忆体颗粒的稳定度也更加提升,确保记忆体颗粒不会因工作时脉过高时,发生烧燬的情况。同时DDR3 SDRAM还加入RASR(Partial Array Self-Refresh)局部Bank刷新的功能,可以针对特定记忆体Bank做更有效率的资料读写,以达到更加省电的效果。值得一提的是,DDR3皆为RoHS规格,保证无毒无害,更为绿色环保尽了一份心力。

    DDR3还新增了重置功能(Reset),重置是DDR3新增的一项重要功能,并为此特定準备了一个引脚。DRAM业界很早以前就要求增加这一功能,直到如今,才终于在DDR3身上实现。这一引脚使DDR3的初始化处理变得简单。当重置命令执行时,DDR3记忆体可以停止所有操作,切换至最少活动量的状态,可使DDR3达到最节省电力的目的。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / DDR3时代开始,市场开始流行Kit包,简单来说,就是厂商挑选好同规格、同製程之同对同捆包,在超频使用上更加稳定可靠。

    DDR4记忆体  X99初登场

    推出甫半年的X99平台,首次导入了千呼万唤始出来的DDR4记忆体模组。相较于DDR3记忆体,DDR4无论在外在或是内在上,都有了更大幅度的演进。首先,DDR3以前的记忆体,金手指都是以平直态在使用者面前呈现,而DDR4在金手指设计上,则略显弯曲状。

    在防呆缺口上,DDR4比DDR3更加接近中间位置,而在金手指接点数量上,DDR4计有284个,比DDR3的240个多出了44个。而也因此,DDR4每一个接点之间的间距,从1mm缩短至0.85mm。

    或许是mini-ITX与大型散热器的流行,DDR3记忆体金手指是整片平直地埋在DIMM槽内,其接触面积相较DDR4更大,摩擦力相对DDR3也来得更大。这对于空间有限的mini-ITX机壳或是大型散热器卡高度的情况下,DDR3记忆体有时在安装或是拔除上,必需得先将散热器卸除才能顺利进行。

    仔细观察DDR4金手指,可以发现中间部位稍显突出,边缘则渐为收矮,在中央的最高点与两端的最低点之间,则带以微弯曲线渡过。如此一来,DDR4金手指既能够与DIMM插槽保有充足的讯号接触面,在拔除记忆体时,也比DDR3来得更加轻鬆许多。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 上方为DDR4记忆体,下方则为DDR3记忆体,仔细观察,你会发现DDR4记忆体的金手指并非平直到底,而是中间略凸,两边微有弯曲。

    Bank Group 分组架构

    相信大家对于DDR4最感兴趣的,莫过于速度与容量上的提昇。从技术白皮书来看,DDR4每针脚位都可提供每秒256MB/s(2Gbps)传输速度,作个简单换算,DDR4-3200的频宽高达51.2GB/s,相较于DDR3-1866高出71.5%,更不用说白皮书中表明DDR4频率可达4266MHz。

    我们知道,DDR记忆体在历代演化的过程中,都採用了所谓的资料预取机制(Prefetch),理所当然DDR4也採用了这项机制。不过,到了DDR4世代,在资料预取上仍沿用DDR3的8n资料预取架构而未有提昇,因此最终DDR4导入了Bank Group分组架构,作为提昇效能的手段之一。

    简单来说,在DDR4的每个Bank Group中,都可以独立读写资料,而Bnak Group可以选择2个或4个独立分组,而DDR4模组内的每单位Bnak Group都可独立进行读取、写入、唤醒及更新等动作。从数量来看,如果记忆体内部设计了2个独立的Bnak Group,那幺资料预取则来到16n;如果使用了4独立的Bank Group,那幺资料预取则一口气提高到32n。

    换言之,如此一来,资料吞吐量得到了直接有效的提昇,其等效频率也随之受益匪浅;一言以蔽之,Bnak Group是DDR4提昇频宽的关键技术之一。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 前后两代DDR记忆体比一比,其实两者在高度上就略有差异。此外,PIN脚数量、间距也有所不同,虽然历代DDR都採用了资料预取机制(Prefetch),但最终DDR4导入了Bank Group分组架构,作为提昇效能的手段之一。

    DDR3 多点分支单流架构

    我们知道,DDR3採用多点分支单流架构,在同一条通道下,可以挂上许多同样规格的记忆体晶片。这样的设计有一个明显的缺点,那就是一旦当资料传输量超过通道最大承载量时,就算记忆体容量提高再多,效能的提昇也是微乎其微。

    简单打个比喻,记忆体容量就好像注水量,只要注水量不超过水管通道传输量,那幺只要专注提昇注水量,那幺最后累积的总水量就会得到显着的提昇;反之,一旦注水量已大于水管传输量时,此时再去增加注水量,对于单位时间内的总水量成长帮助不大。

    换言之,将记忆体从2GB昇级到4GB,你可以感受到速度变快、效能提昇,那是因为传输通道还没被吃满,但只要容量往上递增,在效能增长上的边际效益将会在达到临界点时失去动力。总评而论,DDR3的多点分支单流架构,在记忆体容量上的增加很简单,但很容易受到单条宝贵的传输频宽之限制。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 简单来说,DDR3採用了大水库理论,所有资料集中到一根大水管后送出。而DDR4则採用点对点分流架构,当每一条水管流量都很大时,累加起来的流量则会超过单一条大水管,而且还能避免瓶颈效应拖慢整体效能。(图片来源︰PC Watch)

    DDR4 点对点传输架构

    在新一代DDR4的架构中,传输部份採用了点对点设计,也就是每一个晶片控制器对应专属唯一的通道,也就是说一口出水井只对应一条输水管,如此一来就不易受到瓶颈效应所带来的限制,模组设计更加简化、频率提昇也更加容易。

    但点对点传输架构的缺点也相当明显,因为点对点的每条通道只能对应一根记忆体,如果单条记忆体容量太小,就像单口井的出水量太少,那幺总传输量也就是总出水量,甚至有可能比DDR3的多点分支单流架构还要来得少。

    解决这个问题的方法既直接又简单,那就是只要把单条记忆体的容量拉大就好啦!老实说,键盘上打字增加容量很简单,实务上可没那幺容易,不然现在记忆体早就一条16GB满街跑了。

    行文至此,我们得把因果关係倒过来看,事实上,是晶圆厂的轮班星人们先发展出所谓的3DS(3-Dimensional Stack,3维堆叠)製程,使得单颗晶片的容量增加,最终才能使得整条记忆体模组的容量一举扩大。也因为有3DS製程,DDR4导入了点对点传输架构,在效能提昇上才有了实质意义。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3 二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 因为有了3DS堆叠封装製程,得以让单条DDR4记忆体容量得以更大,才使得DDR4的点对点传输架构变得有意义。

    TSV硅穿孔 3DS堆叠封装

    3DS製程最早由美光(Micron Technology)所提出,这是一种堆叠封装技术,而实作手法又有两种,一种是单颗晶片在封装完成后,在PCB上堆叠;另一种则是在晶片封装之前,在晶片内部进行堆叠。在绝大多数的情况下,只要能够解决散热问题,内部堆叠封装可以一举大幅降低晶片面积,最大的好处就是对于製成品的小型化有相当大的帮助。

    在DDR4中,实现3DS堆叠製程的关键推手,则是硅穿孔技术(TSV,Through Silicon Via)。TSV以雷射或蚀刻为手段,在硅晶圆打出一个小洞,然后以导电材质穿过这个小洞后将多个硅晶圆串接起来,此后不同硅晶圆之间的讯号便得以传输。

    也就是说,透过3DS製程的堆叠封装,使得单一晶片的发热量更小、容量更大,因此在DDR4记忆体模组成品上,就可以塞下更多的晶片,单条记忆体容量也随之更大。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 透过TSV硅穿孔技术,得以将多个硅晶圆串接起来,最终在3DS堆叠封装製程下,晶片的发热量更小、容量更大。

    低电压 低功耗

    DDR4的另一个亮点,则是能够以相对DDR3更低的电压运行系统。事实上,DDR4相较于DDR3,由于时代的进步,製程工艺本来就较为先进,以本次搭配测试的Kingstone DDR4记忆体为例,颗粒採用20nm製程,因此能以1.2V电压稳定运行系统,相较于DDR3标準工作电压1.5V,理论上拥有两成以上的节能效率。

    除此之外,DDR4搭载了温度自更新回馈机制(TCSE,Temperature Compensated Self-Refresh),能够降低晶片在自动更新时所需耗费的电力,同时,还导入了资料汇流反转机制(DBI,Data Bus Inversion),使得VDDQ电流量得到有效控制。平心而论,DDR4在功耗上的下降,还是称得上与时俱进。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 从图表中,我们可以看到初代DDR一路演进到DDR4,对于功耗上的表现都有着亮眼的进步。

    DDR3 / DDR4  效能、频宽测试

    由于目前Z97消费级平台仍採用DDR3模组,而X99旗舰级平台则採用新一代DDR4模组。为了测试出DDR3与DDR4之间的实力差距,胖达挑选了前后两代旗舰进行测试。由于X79与X99对应的处理器脚位并不相容,所以我们还是先对处理器与记忆体同时进行简易测试,藉以更加客观的面向评论DDR3与DDR4之间的差距。

    对于处理器在游戏上的效能表现,胖达选择使用3DMARK中的物理分数,作为一个评断指标。此时,代表Haswell-E阵营的Core i7-5960X得分为14858,而Ivy-Bridge的代表Core i7-4960X,得分为13127。换言之,新旗舰Core i7-5960X领先幅度达13.19%。

    在新一代DDR4记忆体的效能成长上,在Sandra记忆体频宽测试项目中,搭载Core i7-5960X的X99平台得分为45.23,而Core i7-4960X的X79平台得分为51.17。换言之,DDR4在X99平台上,领先DDR3在X79上的频宽幅度达13.13%。

    此外,在Sandra缓存与记忆体测试项目中,搭载Core i7-5960X的X99平台得分为337.83,而Core i7-4960X的X79平台得分为243.12。换言之,DDR4在X99平台上,领先DDR3在X79上的效能幅度高达38.96%。

    最后,胖达测试了新旧两代旗舰在Sandra密码学频宽的效能表现,搭载Core i7-5960X的X99平台得分为10.89,而Core i7-4960X的X79平台得分为7.62。换言之,新旗舰Core i7-5960X效能领先幅度高达42.91%。

    在温度方面,胖达在室温摄氏29度下,以ENERMAX ETS-40空冷散热器,运行3DMARK。透过TES-1326S 红外线测温枪,量得X99平台处理器为摄氏73.6度,X79平台处理器为摄氏78.3度;透过松大变电家量测功耗,量得X99平台功耗为218瓦,X79平台功耗为223瓦。换言之,X99平台功耗略低,但温度却低了不少,这意谓着每一分电力的转换效率更高,因此废热更少,最终测量出来的温度才会低上许多。胖达猜测,这应该是FIVR与DDR4两项关键因素优化出来的结果,或许这也解释了为何Core i7-5960X的TDP比起Core i7-4960X略高,但最后X99平台功耗竟比X79还低的原因吧。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    记忆体的未来展望

    早些时候,IBM在公司成立百年的庆祝活动中,高调展示出Phase Change Memory(PCM),号称「瞬间」记忆体,领先现行的随机动态存取记忆之读写速度不可以道里计。

    这种记忆体的原理,是运用一种特殊合金为开发基础,其拥有结晶与不定形的两种形态,这种合金在结晶时电阻低,导电性极佳;但在不定形状态下电阻就变得很高。因此我们便可以利用通电来改变结晶或不定形,来重新订义0与1的资料予以存取。这种方式在效果上类似忆阻器,和现行快闪记忆体相较之下,读写速度号称可以快上近百倍,更惊人的是,可以稳定地使用数百万个写入循环,相对于现在流行的快闪记忆体约数几千次寿命便宣告结束,可以说是让人期待的新技术。除上述所言,IBM在PCM的基础上,成功发展出一套方法,将原本在一个单位的电晶体上,仅能储存1bit(0、1)两种状态,变成可以储存2bit(00、01、10、11)四种状态,如此一来,容量瞬间翻倍。除了在速度上更有效率之外,对于容量加大、资料保存的可靠度,都将再踏入一个全新进化的领域。

    另一方面,英特尔携手美光于今年7月29日宣布开发出新世代记忆体技术「3D Xpoint」,据称其储存的资料比 DRAM 高出十倍,读写速度与耐受度更是 NAND 型快闪记忆体的 1 千倍之多。

    前文提到,NAND 型快闪记忆体在读取或写入资料时,不会直接针对某个记忆体单元动作,而是会读取一整排的单元、然后选出需要的资讯。相较之下,3D XPoint 则可指定特定的记忆体单元,经由电路把资料存入,这些电路被排列成水平与垂直线,其交会点可为每一个单元创造位址。

    根据英特尔的说法,3D XPoint以类3D架构之姿,将记忆体单元层层堆叠,而由于这些单元是被摆在电路中间,因此的确能够设计出一个多层架构,把单元与电路依序堆叠起来。英特尔也预计今年下半年就能将 3D XPoint 记忆体原型配送给企业伙伴,产品将在 2016 年问世,希望胖达明年就有测试的机会,再和读者们一起分享。

    这次简单地为读者们介绍了记忆体的发展简史,希望大家能够对这项重要的储存、传输元件有一个初步的了解,相信日后对你在记忆体超频,或是研究固态硬碟的颗粒组成,可以有一个基本的认识。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / IBM展出Phase Change Memory之原型,能否像DRAM一样独领风骚数十年,就让我们拭目以待。

    二进位的世界:记忆体发展简史 / DDR4 VS DDR3

    图 / 胖达非常看好英特尔与美光所开发出来的3D XPoint技术,其储存的资料比 DRAM 高出十倍,读写速度与耐受度更是 NAND 型快闪记忆体的 1 千倍之多,简直就是外星科技的火力展示。



    上一篇:
    下一篇:
  • 热门文章

     Sony XBA

    Sony XBA

     Sony Xperia 1 DxO 超越 Xperia XZ

    Sony Xperia 1 DxO 超越 Xperia XZ

     Sony Xperia 1 三镜头手机登台,5 月底公布售价

    Sony Xperia 1 三镜头手机登台,5 月底公布售价