• 3.92 MB
  • 2022-04-22 11:44:05 发布

分析Intel公司Pentium系列CPU结构设计

  • 14页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'分析Intel公司Pentium系列CPU结构设计一、课题分析承接着80486大获成功的东风,赚大笔美金的Intel在1993年推出了全新一代的高性能处理器——Pentium。PentiumCPU它是世界上第一款与数字无关的处理器,堪称为当代CISC机器的经典之作。由运算器和控制器组成中央微处理器即CPU。要分析Intel公司PentiumCPU结构设计,首先我们要对PentiumCPU的结构和功能进行深刻的了解,进而对它的优点和缺点进行分析,最后针对缺点进行假想,从而写出一份针对PentiumCPU的改进方案。我将从以下几个方面对其进行分析:1.核心技术2.发展进程3.Pentium的结构框图4.Pentium性能简介5.原理结构6.多Cache技术7.超标量流水线8.问题及建议工作安排:分工表王宏斌分析Pentium及早期Pentiumcpu殷贤波分析PentiumII与PentiumVI比较金小敏分析PentiumIII与PentiumVI比较汇总总结分析Pentium系列机结构特点二、Pentium系列CPU总体概况分析  奔腾商标Pentium是英特尔的第五代x86架构之微处理器,于1993年3月22日开始出货,是486产品线的后代。Pentium本应命名为80586或i586,后来命名为“Pentium”(通常认为“pentium”是希腊文“五(penta)”加拉丁文中代表名词的接尾语“ium”的造词),是因为阿拉伯数字无法被用作注册商标。i586被使用在英特尔竞争对手所制造的类80586的微处理器。1核心技术Tualatin13 这也就是大名鼎鼎的“图拉丁”核心,是Intel在Socket370架构上的最后一种CPU核心,采用0.13μm制造工艺,封装方式采用FC-PGA2和PPGA,核心电压也降低到了1.5V左右,主频范围从1GHz到1.4GHz,外频分别为100MHz(赛扬)和133MHz(PentiumIII),二级缓存分别为512KB(PentiumIII-S)和256KB(PentiumIII和赛扬),这是最强的Socket370核心,其性能甚至超过了早期低频的Pentium4系CPU。WillametteNetburst微架构是P6微架构的后继者,第一个使用这架构的是Willamette核心,于2000年推出。Willamette核心制造工艺落后,发热量大,性能低下,已经被淘汰掉,而被Northwood核心所取代。Northwood第二个Pentium4核心,代号为Northwood,改用了更为精细的0.13微米制程,集成了更大的512KB二级缓存,性能有了大幅的提高。按照Intel的规划,Northwood核心会很快被Prescott核心所取代。PrescottPrescott核心的P4处理器发热量要比Northwood核心的大很多。性能接近。这是目前高端的Pentium4EE、主流的Pentium4和低端的CeleronD所采用的核心。Prescott核心与Northwood核心最大的区别是采用了90nm制造工艺,L1数据缓存从8KB增加到16KB,流水线结构也从20级增加到了31级,并且开始支持SSE3指令集。按照Intel的规划,Prescott核心会被CedarMill核心取代。Smithfield这是Intel公司的第一款双核心处理器的核心类型,于2005年4月发布,基本上可以认为Smithfield核心是简单的将两个Prescott核心松散地耦合在一起的产物,这是基于独立缓存的松散型耦合方案,其优点是技术简单,缺点是性能不够理想。其数据延迟问题比较严重,性能并不尽如人意。按照Intel的规划,Smithfield核心将会很快被Presler核心取代。CedarMill这是Pentium46X1系列和CeleronD3X2/3X6系列采用的核心,从2005末开始出现。其与Prescott核心最大的区别是采用了65nm制造工艺,其它方面则变化不大,基本上可以认为是Prescott核心的65nm制程版本。Cedar13 Mill核心也是Intel处理器在NetBurst架构上的最后一款单核心处理器的核心类型,按照Intel的规划,CedarMill核心将逐渐被Core架构的Conroe核心所取代。Presler这是PentiumD9XX和PentiumEE9XX采用的核心,Intel于2005年末推出。基本上可以认为Presler核心是简单的将两个CedarMill核心松散地耦合在一起的产物,是基于独立缓存的松散型耦合方案,其优点是技术简单,缺点是性能不够理想。按照Intel的规划,Presler核心从2006年第三季度开始将逐渐被Core架构的Conroe核心所取代。Yonah目前采用Yonah核心CPU的有双核心的CoreDuo和单核心的CoreSolo,另外CeleronM也采用了此核心,Yonah是Intel于2006年初推出的。这是一种单/双核心处理器的核心类型,其在应用方面的特点是具有很大的灵活性,既可用于桌面平台,也可用于移动平台;既可用于双核心,也可用于单核心。Yonah核心来源于移动平台上大名鼎鼎的处理器PentiumM的优秀架构,具有流水线级数少、执行效率高、性能强大以及功耗低等等优点。Yonah核心是共享缓存的紧密型耦合方案,其优点是性能理想,缺点是技术比较复杂。不过,按照Intel的规划,以后Intel各个平台的处理器都将会全部转移到Core架构,Yonah核心其实也只是一个过渡的核心类型,从2006年第三季度开始,其在桌面平台上将会被Conroe核心取代,而在移动平台上则会被Merom核心所取代。2发展进程Pentium的由来继承着80486大获成功的东风,赚大笔美金的Intel在1993年推出了全新一代的高性能处理器——Pentium。由于市场竞争越来越趋向于激烈化,Intel觉得不能再让AMD和其他公司用同样的名字来抢自己的饭碗了,于是提出了商标注册,由于在美国的法律里是不允许用阿拉伯数字注册的,于是Intel玩了个花样,用拉丁文去注册商标。“pentium13 ”在拉丁文里面就是“五”的意思。Intel公司还替它起了一个相当好听的中文名字——奔腾。Intel奔腾处理器486后的改版超标量(Superscalar)架构-Pentium拥有两个资料路径(管线,pipelines),可以达到在一个时钟周期内完成一个以上的指令。一个管线(称为"U")可以处理任何的指令,而另外一个(称为"V")可以处理简单,最共同的指令。使用一个以上的管线是传统RISC处理器设计的特色,这也是在许多x86平台上第一个实作出来的,显示有将两种技术合并的可能性,创造出几乎“混合在一起”的处理器。PentiumMMX接著,P55C也以PentiumwithMMXTechnology推出(通常只称为PentiumMMX);他是以P5核心为基础,0.35µm制程也在这个系列中使用,但是拥有新的57个"MMX"指令集来增进多媒体工作的效率,像是媒体的编码跟解压缩。然而,软体必须明确地对於使用MMX做最佳化,以及P55C显示出速度增加的幻象主要是来自於内部快取(cache)的容量变成两倍为32KB。Intel奔腾MMX处理器PentiumPro初步占据了一部分CPU市场的INTEL并没有停下自己的脚步,在其他公司还在不断追赶自己的奔腾13 之际,又在1996年推出了最新一代的第六代X86系列CPU枣P6。P6只是它的研究代号,上市之后P6有了一个非常响亮的名字枣PentimuPro。Intel奔腾Pro处理器PentimuPro的内部含有高达550万个的晶体管,内部时钟频率为133MHZ,处理速度几乎是100MHZ的PENTIUM的2倍。PentimuPro的一级(片内)缓存为8KB指令和8KB数据。PentiumII为英特尔推出的一枚X86架构的处理器,基于PentiumPro使用的P6微处理架构,但另一方面它的16位元处理能力获得优化,并加入MMX指令集。与Pentium及PentiumPro处理器不同,PentiumII使用一种插槽式设计。处理器芯片与其他相关芯片皆在一块类似子卡的电路板上,而电路板上有一块塑胶盖,有时亦有一风扇。PentiumII亦把L2放到这电路板上,但只运行处理器时脉一半的速度。此举增加处理器的良率,从而减低制作成本。Intel奔腾Ⅱ处理器PentiumIII同年,英特尔又发布了PentiumIII处理器。从PentiumIII开始,英特尔又引入了70条新指令(SIMD,SSE),主要用于因特网流媒体扩展(提升网络演示多媒体流、图像的性能)、3D、流式音频、视频和语音识别功能的提升。PentiumIII可以使用户有机会在网络上享受到高质量的影片,并以3D13 的形式参观在线博物馆、商店等。第一代PentiumIII处理器(Katmai)PentiumIV2000年英特尔发布了Pentium4处理器。用户使用基于Pentium4处理器的个人电脑,可以创建专业品质的影片,透过因特网传递电视品质的影像,实时进行语音、影像通讯,实时3D渲染,快速进行MP3编码解码运算,在连接因特网时运行多个多媒体软件。这是目前空前强大的个人电脑处理器产品,仍然在继续销售中。Pentium4处理器集成了4200万个晶体管,到了改进版的Pentium4(Northwood)更是集成了5千5百万个晶体管;并且开始采用0.18微米进行制造,初始速度就达到了1.5GHz。Pentium4还提供的SSE2指令集,这套指令集增加144个全新的指令,在128bit压缩的数据,在SSE时,仅能以4个单精度浮点值的形式来处理,而在SSE2指令集,该资料能采用多种数据结构来处理:4个单精度浮点数(SSE)对应2个双精度浮点数(SSE2);对应16字节数(SSE2);对应8个字数(word);对应4个双字数(SSE2);对应2个四字数(SSE2);对应1个128位长的整数(SSE2)。第一代的Pentium4(Socket423)处理器PentiumMPentiumM:由以色列小组专门设计的新型移动CPU,PentiumM是英特尔公司的x86架构微处理器,供笔记簿型个人电脑使用,亦被作为Centrino的一部分,于2003年3月推出。PentiumD2005年Intel推出的双核心处理器有PentiumD和PentiumExtremeEdition,同时推出945/955/965/975芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。桌面平台的核心代号Smithfield的处理器,正式命名为PentiumD处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。13 PentiumEE同出自Intel之手,而且PentiumD和PentiumExtremeEdition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。PentiumD不支持超线程技术,而PentiumExtremeEdition则没有这方面的限制。在打开超线程技术的情况下,双核心PentiumExtremeEdition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。PentiumE2200经历了Core2Duo处理器对高端市场的洗礼之后,Intel在07年第二季度推出了新一代的低端双核心处理器PentiumE2000系列,主要面向注重性价比的入门级双核处理器市场。首批推出的PentiumE2000系列包括两款产品,分别为E2160和E2140,频率只有1.8GHz和1.6GHz,但性能十分强大,已经能够满足多数用户的需求。但Intel并没有就此作罢,在稍后除PentiumE2000系列处理器全部升级到M0核心之外,日前正式发布了频率更高的PentiumE处理器——频率提高到2.2GHz的PentiumE2200。PentiumG620PentiumG620可以看成Corei32100的进一步精简版,包括不支持AVX指令集等SandyBridge的新特性。PentiumG620是基于SandyBridge微架构,采用32nm制作工艺、CPU部分是双核/双线程设计、LGA1155接口、主频为2.6GHZ、外频为100MHZ(不可超频),内置HDGraphics核芯显卡,拥有6组EU执行单元,CPU与GPU共享3MB高速缓存。13 3Pentium的结构框图BTB转移目标缓冲指令cache8k欲取缓冲指令译码控制ROM页面部件控制部件地址地址产生产生(U流水线)(V流水线)浮点部件整数寄存器堆ALU(U)ALU桶形移位器数据cache8kTLBLB控制加法除法乘法TLB寄存器堆总线部件13 PentiumCPU结构框图系统界面L2cacher和控制BTB及1-TLB转移目标缓冲器取指译码跟踪cacher微指令码ROM换名分配微指令队列调度器整数寄存器组浮点寄存器组存数地址生成取数地址生成浮点存储浮点传送浮点乘浮点除MMXL1数据cacher和D-TLBALUALUALUALUPentium-4CPU结构框图13 奔腾处理器内部结构三、详细分析1Pentium性能简介1993年3月Intel公司推出了第五代微处理器PentiumPentium是微处理器本质上的一次创新。Pentium采用了0.8μm双极性互补金属氧化半导体(BiCMOS)技术,它属于单芯片超标量流水线微处理器,片内集成了多达310万个晶体管,工作电压+5V,功耗15W。片内时钟频率(微处理器主频)与外片主总线的时钟频率相等,均为60MHz或66MHz两种。1994年3月之后推出的Pentium(P54C)采用了0.6μm的CMOS技术,工作电压降为3.3V,功耗降至4W。主总线时钟频率有50MHz、60MHz以及66MHz等,经倍频后作为Pentium(P54C)内部的时钟频率(主频),表3-1列出了几种Pentium(P54C)的主频与工作电压。几种Pentium的主频与工作电压型号主总线时钟频(MHz)倍数因子主频(MHz)工作电压Pentium-90601.5903.3V或2.9VPentium-100601.51003.3VPentium-1206021203.3VPentium-1336021333.3VPentium-150602.51503.3VPentium-166662.51663.3VPentium-2006632003.3VPentium通往外部存储器的数据总线为64位,CPU内部主要寄存器的宽度仍然为32位,那么Pentium、Pentium(P54C)应该是32位微处理器。外部64位数据总线(D63-D0)每次可同时传输8字节的二进制信息,若选用主总线时钟频率66MHz计算,即存储器总线的时钟频率也为66MHz,则Pentium与主存储器交换数据的速率可为528MB/S。2Pentium的原理结构PentiumCPU内部的主要部件:①总线接口部件②U流水线和V流水线13 ③指令高速缓冲存储器Cache④数据高速缓冲存储器Cache⑤指令预取部件⑥指令译码器⑦浮点处理部件FPU⑧分支目标缓冲器BTB⑨微程序控制器中的控制ROM⑩寄存器组Pentium微处理器的原理结构图如图所示所以PentiumCPU堪称为当代CISC机器的经典之作。四、侧重点分析与研究1多Cache技术80486CPU中有8KB的指令和数据共用的cache。而奔腾CPU则分设指令cache和数据13 cache,各8KB。指令cache是只读的,以单端口256位(32B)向指令预取缓冲器提供超长指令字代码。数据cache是可读可写的,双端口,每个端口32位,与U,V两条流水线交换整数数据,或组合成一个64位端口与浮点运算部件交换浮点数据。两个cache与64位数据、32位地址的CPU内部总线相连接。两个cache都使用物理地址。每个cache都有一个后援缓冲器TLB,负责将TLB命中的线性地址转换成32位物理地址。2超标量流水线超标量流水线是pentium系统结构的核心。它由U和V两条指令流水线构成,每条流水线都有自已的ALU、地址生成电路、与数据cache的接口。  控制ROM属于微程序控制器,其中存放一组解释指令操作顺序的微指令代码。  两个地址生成器用于计算存储器操作数地址。各种模式下的逻辑地址最终要转换成物理地址来访问数据cache,并用转换后援(旁视)缓冲器TLB来加速这种地址转换过程。寄存器堆有8个32位整数寄存器,用于地址计算、保存ALU的源操作数和目的操作数。五、存在问题及改进建议要讲CPU,就必须先讲指令系统。指令系统指的是一个CPU所能够处理的全部指令的集合,是一个CPU的根本属性。之所以说指令系统是一个CPU的根本属性,是因为指令系统决定了一个CPU能够运行什么样的程序,进行什么操作。所有采用高级语言编出的程序,都需要翻译(编译或解释)成为机器语言后才能运行,这些机器语言就是由一条条的指令组成的。通常,一条指令包括两个部分:操作码和地址码。操作码其实就是指令序列号,用来告诉CPU需要执行哪一条指令。地址码则复杂一些,主要包括源操作数地址、目的操作数地址。在某些指令中,地址码可以部分或全部省略,比如一条空指令就只有操作码而没有地址码。从微处理器的指令系统来看,目前主要有两种发展趋势,一个是CISC,一个是RISC。CISC的产生、发展和现状某一系列CPU,如IntelX86系列机,为了增加新的功能与提高速度,越来越多的复杂指令被加入到指令系统中。但是,这样就导致一个问题:一个指令系统的指令数是受指令操作码的位数所限制的,如果操作码为8位,那么指令数最多为256条(2的8次方)。那么怎么办呢?指令的宽度是很难增加的,聪明的设计师们又想出了一种方案:操作码扩展。由于操作码的后面跟着的是地址码,而有些指令是用不着地址码或只用少量的地址码的。那么,就可以把操作码扩展到这些位置。然后,为了达到操作码扩展的先决条件:减少地址码,设计师们又广开思路,发明了各种各样的寻址方式,如基址寻址、相对寻址等,用以最大限度地压缩地址码长度,为操作码留出空间。就这样,慢慢地,CISC指令系统就形成了,大量的复杂指令、可变的指令长度、多种的寻址方式是CISC的特点,也是CISC的缺点:因为这些都大大增加了解码的难度,而在现在的高速硬件发展下,复杂指令所带来的速度提升早已不及在解码上浪费的时间。要改进这一缺点,使计算机既有复杂指令又可以在能容忍的时间上解码,我的建议是:制作一种新的而且速度超快的解码方式。从而减少解码所花费的时间,大大的提高计算机的运行速度。六、实验器材13 1、湖北众友公司ZY15CompSys12BB计算机组成原理及系统结构教学实验箱;2、PC机与网络。七、附录执行设计之前,我们进行了简单模型机和复杂模型机的实验,实验附图如下:八、参考文献及相关网址1.《计算机组成原理(第四版·立体化教材)》,白中英主编,08年1月第四版,科学出版社2.《计算机组成原理及系统结构实验指导书(V1.01)》,湖北众友科技实业股份有限公司3.ㄍIntel微处理器:从8086到Pentium系列体系结构编程与接口技术》.4.奔腾Ⅱ/Ⅲ处理器系统结构作者:张昆藏 出版社:电子工业出版社5.80×86/Pentium微机原理及接口技术(第2版)(配有电子课件,教学大纲,习题库)6.80x86/Pentium微型计算机原理及应用(第3版)7.Pentium系列微型计算机原理与接口技术8.Intel微处理器——从8086到Pentium系列体系结构、编程与接口技术(第5版)(影印版)9.ThePentiumMicroprocessorAntonakos,JamesL.PrenticeHall&IBD(1996-11出版)13 10.baidu,com13'