存储器基础概念讲解?计算机基础知识存储器

精选笔记 bchgfjyf56547 2024-04-10 10:29 12 0

一、计算机基础知识存储器

内存储器

微型计算机的内存储器是由半导体器件构成的。从使用功能上分,有随机存储器(Random Access Memory,简称 RAM),又称读写存储器;只读存储器(Read Only Memory,简称为ROM)。

1.随机存储器(Random Access Memory)

RAM有以下特点:可以读出,也可以写入。读出时并不损坏原来存储的内容,只有写入时才修改原来所存储的内容。断电后,存储内容立即消失,即具有易失性。 RAM可分为动态( Dynamic RAM)和静态(Static RAM)两大类。DRAM的特点是集成度高,主要用于大容量内存储器;SRAM的特点是存取速度快,主要用于高速缓冲存储器。

2.只读存储器(Read Only Memory)

ROM是只读存储器。顾名思义,它的特点是只能读出原有的内容,不能由用户再写入新内容。原来存储的内容是采用掩膜技术由厂家一次性写入的,并永久保存下来。它一般用来存放专用的固定的程序和数据。不会因断电而丢失。

外存储器

计算机的存储器由两部分组成——内存储器和外存储器。内存储器最突出的特点是存取速度快,但是容量小、价格贵;外存储器的特点是容量大、价格低,但是存取速度慢。内存储器用于存放那些立即要用的程序和数据;外存储器用于存放暂时不用的程序和数据。内存储器和外存储器之间常常频繁地交换信息。需要指出的是外存储器也属于输入输出设备,它只能与内存储器交换信息,不能被计算机系统的其它部件直接访问。外存储器主要有磁盘存储器、磁带存储器和光盘存储器。磁盘是最常用的外存储器,通常它分为软磁盘和硬磁盘两类。

二、计算机应用基础教案

知识培养目标:计算机系统的组成;

操作系统概念;存储器分类

能力培养目标:培养学生积极发挥能力;

重点和难点:计算机硬件系统

教学方法:讲授法

课时分配:2课时

教学过程:计算机系统是由硬件系统和软件系统两大部分组成的。

一、计算机软件系统分为系统软件和应用软件。

1、系统软件:系统软件是管理、监控、维护计算机资源以使

计算机高效率工作的软件。

(1)操作系统:为了使计算机系统的所有资源协调一致,有条不紊地工作,必须有一个软件来进行统一管理和统一调度,这种软件称为操作系统,简称OS。

(2)计算机语言:按语言对机器的依赖程度可以分为机器语言、汇编语言和高级语言三类。

2、应用软件:是指用户编制的用于解决各种实际问题的程序。

二、计算机硬件系统:微型计算机的硬件系统由中央处理器、

主存储器、外存储器、输入/输出设备组成。

1、中央处理器:中央处理器(CPU)是计算机的核心部件。

它主要负责解释,执行规定的计算机基本操作指令,完成对各种信息的加工处理工作。它由运算器、控制器二大功能部件和若干寄存器组成,在微型计算机系统中,中央处理器也称为微处理器。

2、存储器:按存储器在计算机中的作用,可以分为主存储器

(内存储器)、辅助存储器(外存储器)、高速缓冲存储器三种。

(1)主存储器:又称内存储器,简称主存、内存,用于存放当前最活跃的程序和数据与外存储器相比,其速度快,容量小,价格较高,主存与CPU直接连接,并与CPU直接进行数据交换。按照存取方式,主存储器可分为随时存取存储器和只读存储器两面类。

①随机存取存储器:简称RAM,可随时读出和写入。

②只读存储器:简称ROM,是一种只能读出不能导入的存储器。

(2)辅助存储器:辅助存储器又名叫外存储器,简称辅助外存。

辅助存储器主要有磁盘存储器、磁带存储器和光盘存储器三类。磁盘存储器通常分为软磁盘存储器和硬磁盘存储器两类。

(3)高速缓冲存储器:主存储器和辅助存储器结合在一起,形成

主--辅存储层次,解决了大容量存储和高成本的矛盾。但主存储器和CPU之间速度相差一个数量级,限制CPU速度潜力的发挥。为了弥补这一差距,在主存与CPU之间设置一种高速缓冲存储器Cache,构成了高速缓冲存储器--主存储器层次的存储结构。Cache的容量小、体积大、价格高,完全由硬件实现,速度高于主存数倍。

3、输入/输出设备:输入/输出设备是计算机系统的外部设备。

输入设备是把数据和程序转换成电信号,并通过计算机的接口电路将这些信号顺序地送入计算机的存储器中,常见的输入设备有:键盘、鼠标、扫描仪、触摸屏、数码相机、摄像机等;输出设备把计算机所产生的结果转换成人们习惯接受的信息形式(如字符、图像、表格、声音等)或其他机器所能接受的形成输出,常见的输出设备有:显示器、打印机、绘图仪、扬声器等。

注:打印机是广泛使用的输出设备,从打印方式分类,有击

打式和非击打式两类。针式打印机是常见的击打式打印机;激光打印机和喷墨打印机是常见的非击打式打印机;针式打印机又称为点阵式打印机。

小结:本节课我们主要学习了计算机系统的组成,计算机系统是由硬件系统和软件系统组成的。分别介绍硬件系统与软件系统的组成,使学生深刻了解计算机的基础知识。

作业:课后习题中的第一题中:8、14;第二题中:1、16、18、19、20、32;第四题中:2、10、16。熟练掌握计算机的基础知识,仔细看书。

板书:

计算机基础知识

一、计算机系统是由硬件系统和软件系统两大部分组成的。

计算机软件系统分为系统软件和应用软件。

①操作系统:为了使计算机系统的所有资源协调一致,有条不紊地工作,必须有一个软件来进行统一管理和统一调度,这种软件称为操作系统,简称OS。

②计算机语言:按语言对机器的依赖程度可以分为机器语言、汇编语言和高级语言三类。

二、计算机硬件系统:微型计算机的硬件系统由中央处理器、主存储器、外存储器、输入/输出设备组成。

1、中央处理器:中央处理器,简称CPU,是计算机的核心部件。它由运算器、控制器二大功能部件和苦干寄存器组成,在微型计算机系统中,中央处理器也称为微处理器。

2、存储器:按存储器在计算机中的作用,可以分为主存储器(内存储器)、辅助存储器(外存储器)、高速缓冲存储器三种。

主存储器又可分为随时存储器(RAM)和只读存储器(ROM)两类。

3、常见的输入设备有:键盘、鼠标、扫描仪、触摸屏、数码相机、摄像机等;常见的.输出设备有:显示器、打印机、绘图仪、扬声器等。

打印机是广泛的输出设备,从打印方式分类,有击打式和非击打式两类。

第二节多媒体系统及计算机的发展与应用

知识培养目标:多媒体系统概念及特性;

计算机的种类、发展及应用

能力培养目标:培养学生的开拓思维能力;

培养学生学习知识与运用知识的能力

重点和难点:对概念的掌握程度

教学方法:讲解法

课时分配:1课时

教学过程:

课前提问:1、计算机系统的组成;2、计算机语言包括哪几种?3、常见的输入、输出设备都有哪些?4、打印机可分为哪两类?

一、多媒体系统的概念

1、多媒体及多媒体系统:简单地说,多媒体就是多种媒体的集成和利用,这些媒体可以是图形、图像、声音、文字、视频、动画等信息综合表示形式。

所谓多媒体系统,是指多媒体终端设备、网络设备、软件服务系统及有关的多媒体数据库组成的有机整体。

2、多媒体系统的特性:集成性、交互性、实时性。

二、计算机的种类

1、计算机的分类:按大小把计算机划分为巨型机、小巨型

机、大型主机、小型机、工作站和个人计算机等六类,另一类分类方法是对日常工作、学习和生活中常用的计算机进行分类,这

种分类方法把计算机分为服务器、工作站、台式计算机、笔记

本计算机、手持式计算机等五大类。

2、计算机及网络的发展:

通常以构成计算机的主要电子器件来划分计算机的发展阶段,据此,计算机的发展已经经历了四代:第一代计算机是以电子管为主要器件;第二代计算机是以晶体管为主要器件;第三代计算机是以中、小规模集成电路为主要器件;第四代计算机是以大规模集成电路和超大规模集成电路为主要器件;第四代计算机标志着微型计算机时代的开始。

3、计算机的应用:早期的计算机应用主要体现在科学计算、

数据处理、计算机控制等几个方面。现代计算机除了传统的应用外,还应用于以下几个方面:办公自动化、计算机辅助系统、虚拟现实人工智能、电子商务。

总结:通过这节的学习,让学生掌握多媒体系统的概念及其特性;了解计算机的分类及其计算机的发展阶段,知道各个阶段的主要器件;计算机的应用的几个方面。

作业:课后第一题中的13;第三题中的4、5。

第三节信息的表示及计算机病毒知识

知识培养目标:信息表示;

计算机病毒知识

能力培养目标:培养学生应用的能力;

开拓思维

重点和难点:数据单位知识

教学方法:讲解法

课时分配:1课时

教学过程:

课前提问:1、多媒体系统的特性有哪些?2、计算机发展经历了几代?各个时期的主要电器件是什么?3、计算机的应用有哪些?

一、信息的表示

1、二进制数与计算机:计算机的电子元器件只认识两种状态

,这两种状态由“0“和”1“分别表示,形成了所谓的二进制数。生活中常用的十进制数是由0~9共十个数字组成的,同样,二进制数由“0”和“1”两个数字组成的,如二进制数“01100101”。计算机中所有的数据或指令都用二进制数表示,但二进制数不便于阅读,书写和记忆通常用十六进制数或八进制数来简化二进制数的表达。

2、数据单位:计算机内的数据有两类:数值数据和符号数据。

表示数据的单位有位和字节等。

位(bit),是计算机处理数据的最小单位,用0或1表示,如二进制数“10011101”是由8个“位”组成的,“位”常用b表示。

三、内存条的基础知识

接口类型,是根据内存条金手指上导电触片的数量来划分的。金手指上的导电触片,也习惯称为针脚数(Pin)。因为不同的内存采用的接口类型各不相同,而每种接口类型所采用的针脚数各不相同。下面就让我带你去看看关于内存条的基础知识吧,希望能帮助到大家!

内存知识详解:接口类型

1、金手指

金手指(connecting finger)是内存条上与内存插槽之间的连接部件,所有的信号都是通过金手指进行传送的。金手指由众多金黄色的导电触片组成,因其表面镀金而且导电触片排列如手指状,所以称为“金手指”。金手指实际上是在覆铜板上通过特殊工艺再覆上一层金,因为金的抗氧化性极强,而且传导性也很强。不过,因为金昂贵的价格,目前较多的内存都采用镀锡来代替。从上个世纪 90年代开始,锡材料就开始普及,目前主板、内存和显卡等设备的“金手指”,几乎都是采用的锡材料,只有部分高性能服务器/工作站的配件接触点,才会继续采用镀金的做法,价格自然不菲。

内存的金手指

内存处理单元的所有数据流、电子流,正是通过金手指与内存插槽的接触与 PC系统进行交换,是内存的输出输入端口。因此,其制作工艺,对于内存连接显得相当重要。

2、内存插槽

最初的计算机系统,通过单独的芯片安装内存,那时内存芯片都采用 DIP(Dual ln-line Package,双列直插式封装)封装,DIP芯片是通过安装在插在总线插槽里的内存卡与系统连接,此时还没有正式的内存插槽。DIP芯片有个最大的问题,就在于安装起来很麻烦,而且随着时间的增加,由于系统温度的反复变化,它会逐渐从插槽里偏移出来。随着每日频繁的计算机启动和关闭,芯片不断被加热和冷却,慢慢地芯片会偏离出插槽。最终导致接触不好,产生内存错误。

内存插槽

早期还有另外一种方法,是把内存芯片直接焊接在主板或扩展卡里,这样有效避免了 DIP芯片偏离的问题,但无法再对内存容量进行扩展,而且如果一个芯片发生损坏,整个系统都将不能使用,只能重新焊接一个芯片或更换包含坏芯片的主板。此种方法付出的代价较大,也极为不便。

对于内存存储器,大多数现代的系统,都已采用单列直插内存模块(Single Inline Memory Module,SIMM)或双列直插内存模块(Dual Inline Memory Module,DIMM)来替代单个内存芯片。这些小板卡插入到主板或内存卡上的特殊连接器里。

3、内存模块

1) SIMM

SIMM(Single Inline Memory Module,单列直插内存模块)。内存条通过金手指与主板连接,内存条正反两面都带有金手指。金手指可以在两面提供不同的信号,也可以提供相同的信号。SIMM就是一种两侧金手指都提供相同信号的内存结构,它多用于早期的 FPM和 EDD DRAM,最初一次只能传输 8bif数据,后来逐渐发展出 16bit、32bit的 SIMM模组。其中,8bit和 16bit SIMM使用 30pin接口,32bit的则使用72pin接口。在内存发展进入 SDRAM时代后,SIMM逐渐被 DIMM技术取代。

2) DIMM

DIMM(Dual Inline Memory Module,双列直插内存模块)。与 SIMM相当类似,不同的只是 DIMM的金手指两端,不像 SIMM那样是互通的,它们各自独立传输信号。因此,可以满足更多数据信号的传送需要。同样采用 DIMM,SDRAM的接口与 DDR内存的接口也略有不同,SDRAMDIMM为 168Pin DIMM结构,金手指每面为 84Pin,金手指上有两个卡口,用来避免插入插槽时,错误将内存反向插入而导致烧毁;

DDR DIMM则采用 184Pin DIMM结构,金手指每面有 92Pin,金手指上只有一个卡口。卡口数量的不同,是二者最为明显的区别。DDR2 DIMM为240pinDIMM结构,金手指每面有 120Pin,与 DDR DIMM一样金手指一样,也只有一个卡口,但是卡口的位置与 DDR DIMM稍微有一些不同。因此,DDR内存是插不进 DDR2 DIMM的,同理 DDR2内存也是插不进 DDR DIMM的。因此,在一些同时具有 DDR DIMM和 DDR2 DIMM的主板上,不会出现将内存插错插槽的问题。

不同针脚 DIMM接口对比。为了满足笔记本电脑对内存尺寸的要求,SO-DIMM(Small Outline DIMM Module)也开发了出来,它的尺寸比标准的 DIMM要小很多,而且引脚数也不相同。同样 SO-DIMM也根据 SDRAM和 DDR内存规格不同而不同。SDRAM的 SO-DIMM只有 144pin引脚,而DDR的 SO-DIMM拥有 200pin引脚。此外,笔记本内存还有 MicroDIMM和 Mini Registered DIMM两种接口。MicroDIMM接口的DDR为 172pin,DDR2为 214pin;Mini Registered DIMM接口为 244pin,主要用于 DDR2内存。

3) RIMM

RIMM(Rambus Inline Memory Module)是 Rambus公司生产的 RDRAM内存所采用的接口类型。RIMM内存与 DIMM的外型尺寸差不多,金手指同样也是双面的。RIMM有也 184 Pin的针脚,在金手指的中间部分有两个靠的很近的卡口。RIMM非 ECC版有 16位数据宽度,ECC版则都是 18位宽。由于 RDRAM内存较高的价格,此类内存在 DIY市场很少见到,RIMM接口也就难得一见了。

基础知识(入门篇)

关于01

我们初学编程时,只知道编写代码,运行程序,却不知道程序是在什么的基础上运行的。只知道声明变量,给变量赋值,数据存储在变量中,却不知道变量是以什么形式存在。

《内存》可以参考《计算机组成原理》和《微机原理》书籍,而作为信息学奥赛的同学们,只需了解《内存》的一些基础知识即可,不必深究。

关于《计算机组成原理》,可参考文章:

【计算机组成原理】(入门篇)

目录02

1、内存的内部结构

2、数据是如何存储在内存中

3、数据在内存中的表现形式

4、存储单元的大小

5、如何从内存中寻找指定的数据(内存地址)

概要03

本篇主要讲解有关《内存》的基础知识,有助于自己在编程上的进一步提升。

为什么学习《内存》的知识可以提升自己对编程进一步的认识呢?

其实,我们学习信奥(C/C++)时,一般只是学习C/C++的相关语法。当我们练习多了,可以熟练地运用各种语法。我们也知道如何将1+1赋给一个int类型变量,也知道不能把整数1赋给string类型变量(对象)。但是1+1赋值操作在内存中是如何实现的呢?为什么浮点型存在误差?为什么int类型与string类型不能直接赋值操作?

我们只知道编写的程序在内存中运行,却不知道数据在内存中是如何存储的。就好比只看到书籍的封面,但不知道书中的内容。

要求04

在学习《内存》之前,我们只需掌握C/C++一些基础知识,可以独立解决一些简单的问题即可。

内存的内部结构

对于信息学奥赛的同学们来说,《内存》这一概念比较抽象。不过,经过阅读文章《【计算机组成原理】(入门篇)》后,相信同学们对内存的概念清晰了不少,至少知道内存是用来存储程序运行的相关数据。

常用数据一般存储在硬盘中,如果对这些数据进行处理(例如使用Word写一篇文章),并不是CPU直接对硬盘的文件进行操作,而是从硬盘相对应的位置把该文件的数据读取到内存中,CPU再对内存中的数据进行处理。简单地说,《内存》是CPU与硬盘进行沟通的“桥梁”。当然,并不一定是硬盘,平时存储数据的设备还有U盘等,统称为外存。

《内存》内部由数以亿计的纳米级电子元件构成。

如上图,内存条由存储芯片、金手指、电路组成。

存储芯片:黑色的方块。每个方块由很多的晶体管组成,可以理解为数据就存储在晶体管中。

金手指:底部的金色金属片。内存条插在主板的内存条插槽中,实际上与插槽接触的部位就是金手指。如此一来,CPU就可以通过主板与内存进行通信。

电路:绿色面板。面板中有许多细微的线路和电阻等电子元件,用于数据的传输。

数据是如何存储在内存中

家里控制电灯的开关,电脑的开关。存储芯片中的晶体管也是如此。程序运行的数据存储在晶体管中。

如上图,每个方格代表一个晶体管。

如下图,每个晶体管都有独立的开关,通电时开,断电时关。此处用白色表示开,黑色表示关。

一个数值并不是只存储在一个晶体管中,是多个晶体管。而多个晶体管构成一个存储单元。

存储单元的大小

存储单元有大小,而一个存储单元的大小是8位(bit)。

内存中常用的存储单位是:位(bit)、字节(Byte)。

1字节=8位

那么一个存储单元也是1字节。

关于《存储单位》的相关知识,会以一篇独立的文章详细讲解。

数据在内存中的表现形式

数据在内存中是以二进制的形式存储。

十进制是由0~9组成,而二进制是由0和1组成。

如上图,这是一个存储单元(8bit),有8个格子,一个格子表示1bit。而每一个格子的值要么0,要么为1。其中,白色表示开,黑色表示关,一般用1和0分别表示开和关。那么用二进制表示是01101001,转换为十进制的值是105,所以该存储单元存储的值就是105。

关于《进制》的相关知识,会以一篇独立的文章详细讲解。

此处只讲解数字数据,其他数据的表现形式很复杂。

如何从内存中寻找指定的数据(内存地址)

先举个例子:

如上图,有几栋楼房,我们都知道,每一栋楼都有一个具体的地址,而一栋楼的每家每户都有各自的房号,从而组成一个完整的地址。而我们的个人居民身份证就有一个详细地址。

居民身份证除了有地址外,还有身份证号码,每一个号码都是唯一。

如何从内存中寻找指定的数据?

内存中的存储单元就像人一样,都有着独一无二的“身份证号码”,就是地址。比如警察叔叔根据身份证号码就能查到对应的个人信息。

再举个例子:

如上图,这是一个书柜,又分成若干个小柜子,现对每个小柜子进行分类放置书籍并设置标签。我们要寻找某一本书时,根据标签就可以轻松找到。程序运行时也是一样,知道要在什么地址进行数据的读写操作。

其他疑问

为什么要分十进制而二进制?

简单说,十进制是给人用的,而二进制是给机器用的。

数据有数字、字母、符号、声音、图像等等。数据是以二进制的形式存储在内存中。

内存数据输出到显示器时,为什么可以显示我们人类能看懂的信息?

内存中的数据是经过转换处理后,我们才能看懂。我们所看到的数据(例如一篇文章、一张照片、一部电影),它们的本质还是二进制。

你不知道的内存知识

一、CPU与内存

先铺垫几个概念,以免后面混乱:

Socket或Processor:指一个物理CPU芯片,盒装还是散装的。上面有很多针脚,直接安装在主板上。

Core:指在Processor里封装一个CPU核心,每个Core都是完全独立的计算单元,我们平时说的4核心CPU,指的就是Processor里面封装了4个Core。

HT超线程:目前Intel与AMD的Processor大多支持在一个Core里并行执行两个线程,此时从操作系统看就相当于两个逻辑CPU(Logical Processor)。大多数情况下,我们程序里提到的CPU概念就是指的这个Logical Processor。

咱们先来看几个问题:

1、CPU可以直接操作内存吗?

可能一大部分老铁肯定会说:肯定的啊,不能操作内存怎么读取数据呢。

其实如果我们用这聪明的大脑想一想,咱们的台式主机大家肯定都玩过。上面CPU和内存条是两个完全独立的硬件啊,而且CPU也没有任何直接插槽用于挂载内存条的。

也就是说,CPU和内存条是物理隔离的,CPU并不能直接的访问内存条,而是需要借助主板上的其他硬件间接的来实现访问。

2、CPU的运算速度和内存条的访问速度差距有多大?

呵呵呵,这么说吧,就是一个鸿沟啊,CPU的运算速度与内存访问速度之间的差距是100倍。

而由于CPU与内存之间的速度差存在N个数量级的巨大鸿沟,于是CPU最亲密的小伙伴Cache闪亮登场了。与DRAM家族的内存(Memory)不同,Cache来自SRAM家族。

而DRAM与SRAM的最简单区别就是后者特别快,容量特别小,电路结构非常复杂,造价特别高。

而Cache与主内存之间的巨大性能差距主要还是工作原理与结构不同:

DRAM存储一位数据只需要一个电容加一个晶体管,SRAM则需要6个晶体管。

由于DRAM的数据其实是被保存在电容里的,所以每次读写过程中的充放电环节也导致了DRAM读写数据有一个延时的问题,这个延时通常为十几到几十ns。

内存可以被看作一个二维数组,每个存储单元都有其行地址和列地址。

由于SRAM的容量很小,所以存储单元的地址(行与列)比较短,可以被一次性传输到SRAM中。DRAM则需要分别传送行与列的地址。

SRAM的频率基本与CPU的频率保持一致,而DRAM的频率直到DDR4以后才开始接近CPU的频率。

3、Cache是怎么使用的?

其实Cache是被集成到CPU内部的一个存储单元(平时也被我们称为高速缓存),由于其造价昂贵,并且存储容量远远不能满足CPU大量、高速存取的需求。

所以出于对成本的控制,在现实中往往采用金字塔形的多级Cache体系来实现最佳缓存效果。

于是出现了,一级Cache(L1 Cache)、二级Cache(L2 Cache)及三级Cache(L3 Cache)。每一级都牺牲了部分性能指标来换取更大的容量,目的也是存储更多的热点数据。

以Intel家族Intel SandyBridge架构的CPU为例:

L1 Cache容量为64KB,访问速度为1ns左右

L2Cache容量扩大4倍,达到256KB,访问速度则降低到3ns左右

L3 Cache的容量则扩大512倍,达到32MB,访问速度也下降到12ns左右(也比访问主存的105ns(40ns+65ns)快一个数量级)

L3 Cache是被一个Socket上的所有CPU Core共享的,其实最早的L3 Cache被应用在AMD发布的K6-III处理器上,当时的L3 Cache受限于制造工艺,并没有被集成到CPU内部,而是被集成在主板上,如图:

从上图我们也能看出来,CPU如果要访问内存中的数据,则需要经过L1、L2、L3三道关卡,就是这三个Cache中都没有需要的数据,才会从主内存中直接进行读取。

最后我们来看下Intel Sandy Bridge CPU的架构图:

二、多核CPU与内存共享的问题

问题:Cache一致性问题

多核CPU共享内存的问题也被称为Cache一致性问题。

其实就是多个CPU核心看到的Cache数据应该是一致的,在某个数据被某个CPU写入自己的Cache(L1 Cache)以后,其他CPU都应该能看到相同的Cache数据。

如果在自己的Cache中有旧数据,则抛弃旧数据。

考虑到每个CPU都有自己内部独占的Cache,所以这个问题与分布式Cache保持同步的问题是同一类问题

目前业界公认的解决一致性问题的最佳方案就是Intel的MESI协议了,大多数SMP架构都采用了这一方案。

解决方案:MESI

不知道大家还记得Cache Line吗,就是我们常说的高速缓存中缓存条目里面的那个缓存行。

其实仔细想想,在进行I/O操作从来不以字节为单位,而是以块为单位,有两个原因:

I/O操作比较慢,所以读一个字节与读连续N个字节的花费时间基本相同

数据访问一般都具有空间连续的特征

所以CPU针对Memory的读写也采用了类似于I/O块的方式

实际上,CPU Cache(高速缓存)里最小的存储单元就是Cache line(缓存行),Intel CPU的一个Cache Line存储64个字节。

每一级Cache都被划分为很多组Cache Line,典型的情况就是4条Cache Line为一组。

当Cache从Memory中加载数据时,一次加载一条Cache Line的数据

如图我们可以看到,每个Cache Line头部都有两个Bit来标识自身状态,总共四种:

M(Modified):修改状态,在其他CPU上没有数据的副本,并且在本CPU上被修改过,与存储器中的数据不一致,最终必然会引发系统总线的写指令,将Cache Line中的数据写回Memory中。

E(E__clusive):独占状态,表示当前Cache Line中的数据与Memory中的数据一致,此外,在其他CPU上没有数据的副本。

S(Shared):共享状态,表示Cache Line中的数据与Memory中的数据一致,而且当前CPU至少在其他某个CPU中有副本。

I(Invalid):无效状态,在当前Cache Line中没有有效数据或者该Cache Line数据已经失效,不能再用;当Cache要加载新数据时,优先选择此状态的Cache Line,此外,Cache Line的初始状态也是I状态

在对Cache(高速缓存)的读写操作引发了Cache Line(缓存行)的状态变化,因而可以将其理解为一种状态机模型。

但MESI的复杂和独特之处在于状态有两种视角:

一种是当前读写操作(Local Read/Write)所在CPU看到的自身的Cache Line状态及其他CPU上对应的Cache Line状态

另一种是一个CPU上的Cache Line状态的变迁会导致其他CPU上对应的Cache Line状态变迁。

如下所示为MESI协议的状态转换图:

具体MESI的实现过程可以看我另一篇文章:看懂这篇,才能说了解并发底层技术

深入理解不一致性内存

MESI协议解决了多核CPU下的Cache一致性问题,因而成为SMP架构的唯一选择,而SMP架构近几年迅速在PC领域(__86)发展。

SMP架构是一种平行的架构,所有CPU Core都被连接到一个内存总线上,它们平等访问内存,同时整个内存是统一结构、统一寻址的。

如下所示给出了SMP架构的示意图:

随着CPU核心数量的不断增加,SMP架构也暴露出天生的短板,其根本瓶颈是共享内存总线的带宽无法满足CPU数量的增加,同时,在一条“马路”上通行的“车”多了,难免会陷入“拥堵模式”。

不知道你是否听说过总线风暴,可以看下:总线风暴

在这种情况下,分布式解决方案应运而生,系统的内存与CPU进行分割并捆绑在一起,形成多个独立的子系统,这些子系统之间高速互联,这就是NUMA(None Uniform Memory Architecture)架构,如下图所示。

可以看出,NUMA架构中的内存被分割为独立的几块,被不同CPU私有化了。

因此在CPU访问自家内存的时候会非常快,在访问其他CPU控制的内存数据时,则需要通过内部互联通道访问。

NUMA架构的优点就是其伸缩性,就算扩展到几百个CPU也不会导致性严重的下降。

NUMA技术的特点

在NUMA架构中引入了一个重要的新名词——Node

一个Node由一个或者多个Socket Socket组成,即物理上的一个或多个CPU芯片组成一个逻辑上的Node

我们来看一个Dell PowerEdge系列服务器的NUMA的架构图:

从上图可以看出其特点:

4个处理器形成4个独立的NUMA Node由于每个Node都为8 Core,支持双线程

每个Node里的Logic CPU数量都为16个,占每个Node分配系统总内存的1/4

每个Node之间都通过Intel QPI(QuickPath Interconnect)技术形成了点到点的全互联处理器系统

NUMA这种基于点到点的全互联处理器系统与传统的基于共享总线的处理器系统的SMP还是有巨大差异的。

在这种情况下无法通过嗅探总线的方式来实现Cache一致性,因此为了实现NUMA架构下的Cache一致性,Intel引入了MESI协议的一个扩展协议——MESIF

针对NUMA的支持

NUMA架构打破了传统的“全局内存”概念,目前还没有任意一种编程语言从内存模型上支持它,当前也很难开发适应NUMA的软件。

Java在支持NUMA的系统里,可以开启基于NUMA的内存分配方案,使得当前线程所需的内存从对应的Node上分配,从而大大加快对象的创建过程

在大数据领域,NUMA系统正发挥着越来越强大的作用,SAP的高端大数据系统HANA被SGI在其UV NUMA Systems上实现了良好的水平扩展

在云计算与虚拟化方面,OpenStack与VMware已经支持基于NUMA技术的虚机分配能力,使得不同的虚机运行在不同的Core上,同时虚机的内存不会跨越多个NUMA Node