logo资料库

intel英特尔多核_多线程技术中文版.pdf

第1页 / 共270页
第2页 / 共270页
第3页 / 共270页
第4页 / 共270页
第5页 / 共270页
第6页 / 共270页
第7页 / 共270页
第8页 / 共270页
资料共270页,剩余部分请下载后查看
1.1.1 计算机与微处理器 1945 年,美国研制了世界上第一台全自动电子数字计算机 ENIAC(Electronic Numerical Integrator and Calculator,即电子数字积分器和计算器),是美国奥伯丁武器试验场为了满足 计算弹道需要而研制成的,于 1946 年 2 月交付使用,共服役 9 年。它采用电子管作为计算 机的基本元件,每秒可进行 5000 次加减运算。它使用了 18000 只电子管,10000 只电容, 7000 只电阻,体积3000 立方英尺,占地170 平方米,重量30 吨,耗电140~150 千瓦。ENIAC 机的问世具有划时代的意义,表明计算机时代的到来。在以后的 40 多年里,计算机技术发 展异常迅速,在人类科技史上还没有一种学科可以与电子计算机的发展速度相提并论。 计算机的发展按照硬件工艺可以分为以下几代: 第一代(1946~1958):电子管数字计算机。计算机的逻辑元件采用电子管,主存储器采用 汞延迟线、磁鼓、磁芯;外存储 器采用磁带;软件主要采用机器语言、汇编语言;应用以 科学计算为主。其特点是体积大、耗电大、可靠性差、价格昂贵、维修复杂。它奠定了以 后计算机技术的基础。 第二代(1958~1964):晶体管数字计算机。晶体管的发明推动了计算机的发展,逻辑元件 采用了晶体管以后,计算机的体积大大缩小,耗电减少,可靠性提高,性能比第一代计算 机有很大的提高。主存储器采用磁芯,外存储器已开始使用更先进的磁盘;软件有了很大 发展,出现了各种各样的高级语言及其编译程序,还出现了以批处理为主的操作系统,应 用以科学计算和各种事务处理为主,并开始用于工业控制。 第三代(1964~1971):集成电路数字计算机。20 世纪 60 年代,计算机的逻辑元件采用小 (Small Scale Integration -- SSI)、中规模集成电路(Medium Scale Integration -- MSI),计算 机的体积更小型化、耗电量更少、可靠性更高,性能比第十代计算机又有了很大的提高。 这时,小型机也蓬勃发展起来,应用领域日益扩大。主存储器仍采用磁芯,软件逐渐完善, 分时操作系统、会话式语言等多种高级语言都有新的发展。
第四代(1971 年以后):大规模集成电路数字计算机。计算机的逻辑元件和主存储器都采用 了大规模集成电路(Large Scale Integration -- LSI)。所谓大规模集成电路是指在单片硅片上 集成 1000~2000 个以上晶体管的集成电路,其集成度比中、小规模的集成电路提高了 1~2 个以上数量级。这时计算机发展到了微型化、耗电极少、可靠性很高的阶段。大规模集成 电路使军事工业、空间技术、原子能技术得到发展,这些领域的蓬勃发展对计算机提出了 更高的要求,有力地促进了计算机工业的空前大发展。 随着大规模集成电路技术的迅速发展,计算机除了向巨型机方向发展外,还朝着超小型机 和微型机方向飞越前进。 微型机的核心是微处理器,微处理器被誉为 20 世纪最伟大的发明之一。微处理器的设计很 规则,可以使工作更加简单,其指令尽量简单,格式统一,寻址方式简单,硬件单元也尽 可能功能单一化,简单化。这样能够大大降低处理器设计的复杂性,提高系统开发的效率。 微处理器的功能单元和寄存器等应该在满足需求的情况下尽可能少,因为电信号传输距离 越远,传输距离越长。因此,寄存器太多将会延长时钟周期。微处理器使用的设计是合适 的折衷,很多情况下,简单和高性能并不能统一,这时就需要合适的折衷,选择一个性能 损失不大却又最简单的实现方案。 由于微处理器具有体积小、重量轻、功耗低、功能强、可靠性高、结构灵活、使用环境要 求低、价格低廉等一系列特点和优点,因此得到了广泛的应用,使计算机真正进入到人类 社会生产和生活的各个方面。计算机从过去只限于各部门、各单位少数专业人员使用普及 到广大民众乃至中小学生,成为人们工作和生活不可缺少的工具,从而将人类社会推进到 了信息时代。
1.1.2 4 位、8 位与 16 位微处理器 1971 年,英特尔公司推出了世界上第一款微处理器4004,这是第一个可用于微型计算机的 四位微处理器,它包含 2300 个晶体管。随后英特尔又推出了 8008,1974 年,8008 发展成 8080,成为第二代微处理器。8080 作为代替电子逻辑电路的器件被用于各种应用电路和设 备中,如果没有微处理器,这些应用就无法实现。 由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各 半导体公司开始竞相生产微处理器芯片。Zilog 公司生产了 8080 的增强型 Z80,摩托罗拉 公司生产了 6800,英特尔公司于1976 年又生产了增强型 8085。这些芯片基本没有改变 8080 的基本特点,都属于第二代微处理器。它们均采用 NMOS 工艺,集成度约 9000 只晶体管, 平均指令执行时间为 1μS~2μS,采用汇编语言、BASIC、Fortran 编程,使用单用户操作系 统。 1978 年英特尔公司生产的 8086 是第一个 16 位的微处理器。很快 Zilog 公司和摩托罗拉公 司也宣布计划生产 Z8000 和 68000。这就是第三代微处理器的起点。 8086 微处理器最高主频速度为 8MHz,具有 16 位数据通道,内存寻址能力为 1MB。同时 英特尔还生产出与之相配合的数学协处理器 i8087,这两种芯片使用相互兼容的指令集,但 i8087 指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。人们将这些 指令集统一称之为 x86 指令集。 1979 年,英特尔公司又开发出了 8088。8086 和 8088 在芯片内部均采用 16 位数据传输, 所以都称为 16 位微处理器,但 8086 每周期能传送或接收 16 位数据,而 8088 每周期只采 用 8 位。因为最初的大部分设备和芯片是 8 位的,而 8088 的外部 8 位数据传送、接收能与 这些设备相兼容。8088 采用 40 针的 DIP 封装,工作频率为 6.66MHz、7.16MHz 或 8MHz, 微处理器集成了大约 29000 个晶体管。 8086 和 8088 问世后不久,英特尔公司就开始对他们进行改进,他们将更多功能集成在芯
片上,这样就诞生了 80186 和 80188。这两款微处理器内部均以 16 位工作,在外部输入输 出上 80186 采用 16 位,而 80188 和 8088 一样是采用 8 位工作。 1981 年,美国 IBM 公司将 8088 芯片用于其研制的 PC 机中,从而开创了全新的微机时代。 也正是从 8088 开始,个人电脑(PC)的概念开始在全世界范围内发展起来。从 8088 应用 到 IBM PC 机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时 代的开始。 1982 年,英特尔公司在 8086 的基础上,研制出了 80286 微处理器,该微处理器的最大主 频为 20MHz,内部、外部数据传输均为 16 位,使用 24 位内存储器的寻址,内存寻址能力 为 16MB。80286 可工作于两种方式,一种叫实模式,另一种叫保护方式。在实模式下,微 处理器可以访问的内存总量限制在 1 兆字节;而在保护方式之下,80286 可直接访问 16 兆 字节的内存。此外,80286 工作在保护方式之下,可以保护操作系统,使之不像实模式或 8086 等不受保护的微处理器那样,在遇到异常应用时会使系统停机。 IBM 公司将 80286 微处理器用在先进技术微机(AT 机)中,引起了极大的轰动。80286 在 以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟内存空间;能同时运 行多个任务;提高了处理速度。最早 PC 机的速度是 4MHz,第一台基于 80286 的 AT 机运 行速度为 6MHz 至 8MHz,一些制造商还自行提高速度,使 80286 达到了 20MHz,这意味 着性能上有了重大的进步。
1.1.3 32 位微处理器 1985 年 10 月 17 日,英特尔划时代的产品 80386 DX 正式发布,其内部包含 27.5 万个晶体 管,时钟频率为 12.5MHz,后逐步提高到 20MHz、25MHz、33MHz、40MHz。80386DX 的内部和外部数据总线是 32 位,地址总线也是 32 位,可以寻址到 4GB 内存,并可以管理 64TB 的虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚 拟 86”的工作方式,可以通过同时模拟多个 8086 微处理器来提供多任务能力。虽然当时 80386 没有完善和强大的浮点运算单元,但配上 80387 协处理器,80386 就可以顺利完成许 多需要大量浮点运算的任务,从而顺利进入了主流的商用电脑市场。另外,30386 还有其 他丰富的外围配件支持,如 82258(DMA 控制器)、8259A(中断控制器)、8272(磁盘控 制器)、82385(Cache 控制器)、82062(硬盘控制器)等。针对内存的速度瓶颈,英特尔 为 80386 设计了高速缓存(Cache),采取预读内存的方法来缓解这个速度瓶颈,从此以后, Cache 就和 CPU 成为了如影随形的东西。 1989 年,英特尔推出 80486 芯片。这款芯片首次实破了 100 万个晶体管的界限,集成了 120 万个晶体管,使用 1 微米的制造工艺。80486 的时钟频率从 25MHz 逐步提高到 33MHz、 40MHz、50MHz。80486 是将 80386 和数学协微处理器 80387 以及一个 8KB 的高速缓存集 成在一个芯片内。80486 中集成的 80487 的数字运算速度是以前 80387 的两倍,内部缓存 缩短了微处理器与慢速 DRAM 的等待时间。并且,在 80x86 系列中首次采用了 RISC(精 简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大 提高了与内存的数据交换速度。由于这些改进,80486 的性能比带有 80387 数学协微处理 器的 80386 DX 性能提高了 4 倍。 1993 年,新一代 586 CPU 问世。为了摆脱 486 时代微处理器名称混乱的困扰,英特尔公司 把自己的新一代产品命名为 Pentium(奔腾)以区别 AMD 和 Cyrix 的产品。Pentium 最初 级的 CPU 是 Pentium 60 和 Pentium 66,分别工作在与系统总线频率相同的 60MHz 和 66MHz 两种频率下,没有倍频设置。早期的奔腾 75MHz~120MHz 使用 0.5 微米的制造工艺,后 期 120MHz 频率以上的奔腾则改用 0.35 微米工艺。奔腾的性能相当平均,整数运算和浮点 运算都不错。
为了提高电脑在多媒体、3D 图形方面的应用能力,许多新指令集应运而生,其中最著名的 三种便是英特尔的 MMX、SSE 和 AMD 的 3D NOW!。 MMX(MultiMedia Extensions,多媒体扩展指令集)是英特尔于 1996 年发明的一项多媒体 指令增强技术,包括 57 条多媒体指令,这些指令可以一次处理多个数据,MMX 技术在软 件的配合下,就可以得到更好的性能。MMX 技术可用于对大量数据和复杂数组进行的复 杂处理,使用 MMX 技术可处理的数据基本单位可以是字节、字,或者是双字。 3D Now!是一种 3D 加速指令集,由 AMD 公司开发。它也是一种 SIMD 数据处理方式,但 它的加速对象却是 CPU 浮点运算。它是一个时钟周期内可以同时处理 4 个浮点运算指令或 两条 MMX 指令。 SSE 是 Streaming SIMD Extension 的缩写,也叫 KNI 指令集。它是被嵌套在 Intel Pentium III 处理器中的第二套多媒体专用指令集。与 MMX 指令集不同的是 SSE 的主要作用是加速 CPU 的 3D 运算能力。它总计包括 70 条指令:50 条 SIMD 浮点指令,主要用于 3D 处理。 12 条新 MMX 指令,8 条系统内存数据流传输优化指令。 2000 年推出的 SSE2,增加了 144 条指令,主要完成双精度向量计算与 128 位整数向量运 算。2004 年推出的 SSE3,增加了 13 条复数运算指令。2007 年推出的 SSE4,增加了 47 条 指令,用于视频加速器、图形构造模块与协处理器加速器。 多能奔腾 Pentium MMX 就是带有 MMX 技术的 Pentium,是在 1996 年底发布的,在原 Pentium 的基础上增加了片内 16KB 数据缓存和 16KB 指令缓存,4 路写缓存以及分支预测 单元和返回堆栈技术,特别是新增加的 57 条 MMX 多媒体指令,使得多能奔腾即使在运行 非 MMX 优化的程序时,也比同主频的 Pentium CPU 要快得多。这 57 条 MMX 指令专门用 来处理音频、视频等数据。这些指令可以大大缩短 CPU 在处理多媒体数据时的等待时间, 使 CPU 拥有更强大的数据处理能力。 奔腾二代 Pentium II ,采用 0.35 微米工艺制造,内部集成 750 万个晶体管,采用了双重独
立总线结构,即其中一条总线连通二级缓存,另一条负责主要内存。Pentium II 使用了一种 脱离芯片的外部高速 L2 Cache ,容量为 512KB,并以 CPU 主频的一半速度运行。作为一 种补偿,英特尔将 Pentium II 的 L1 Cache 从 16KB 增至 32KB。 在 1998 年至 1999 年间,英特尔公司推出了比 Pentium II 功能更强大的至强微处理器 Xeon。 该款微处理器采用的核心和 Pentium II 差不多,0.25 微米制造工艺,支持 100MHz 外频。 Xeon 最大可配备 2MB Cache ,并运行在 CPU 核心频率下,它和 Pentium II 采用的芯片不 同,被称为 CSRAM(Custom Static RAM,定制静态存储器)。除此之外,它支持八个 CPU 系统;使用 36 位内存地址和 PSE 模式(PSE36 模式),最大 800MB/s 的内存带宽。至强微 处理器主要面向对性能要求更高的服务器和工作站系统。 英特尔为进一步抢占低端市场,于 1998 年 4 月推出了一款廉价的赛扬微处理器 Celeron。 早期的 Celeron 与 Pentium II 相比的主要差别是去掉了片上的 L2 Cache,此举虽然大大降低 了成本,但也正因为没有二级缓存,该微处理器在性能上有所不足。为弥补缺乏二级缓存 的 Celeron 微处理器性能上的不足,英特尔发布了采用 Mendocino 核心的新 Celeron 微处理 器,采用 0.25 微米工艺制造,同时它采用 Slot 1 架构及 SEPP 封装形式,内建 32KB L1 Cache、 128KB L2 Cache,且以 CPU 相同的核心频率工作,从而大大提高了 L2 Cache 的工作效率。 1999 年春,英特尔公司发布了采用 Katmai 核心的新一代微处理器—Pentium III,俗称奔三。 该微处理器除采用 0.25 微米工艺制造,内部集成 950 万个晶体管,Slot 1 架构之外,它还 具有以下新特点:系统总线频率为 100MHz;采用第六代 CPU 核心—P6 微架构,针对 32 位应用程序进行优化,双重独立总线;一级缓存为 32KB(16KB 指令缓存加 16KB 数据缓 存),二级缓存大小为 512KB,以 CPU 核心速度的一半运行;采用 SECC2 封装形式;新增 加了能够增强音频、视频和 3D 图形效果的 SSE 指令集。Pentium III 的起始主频为 450MHz。 2000 年,英特尔公司发布 Intel Pentium 4,俗称奔四。Pentium 4 处理器的诞生,是英特尔 微处理器技术的另一个里程碑。这种基于 0.18 微米工艺技术,共容纳 4200 万个晶体管的 产品,采用了英特尔全新的 NetBurst 体系架构,依靠超级流水线技术、快速执行引擎、 400MHz 系统总线、改进的浮点运算等技术,为数字时代的用户提供了个性化的快速处理 音频/视频、制作个人电影、下载 MP3 音乐、进行庞大 3D 游戏等功能。
2002 年 ,英特 尔 推 出 新 款 Intel Pentium 4 处理器内 含 创 新 的 超 线 程 技 术( HT , Hyper-Threading)。超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理 芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了 CPU 的闲置时间,提高的CPU 的运行效率。采用超线程技术可在同一时间里,使应用程序 能够使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一 时刻只能够对一条指令进行操作。而超线程技术可以使芯片同时进行多线程处理,使芯片 性能得到提升。 2005 年 4 月 18 日,英特尔全球同步首发基于双核技术桌面产品英特尔奔腾 D 处理器,正 式揭开 x86 处理器多核心时代。 在 x86 微处理器发展的同时,人们也在进行计算机并行化的探索,又出出现了并行计算机 体系结构,与多核微机走了不同的道路。
分享到:
收藏