• 74.50 KB
  • 2022-04-22 11:18:08 发布

计算机系统结构——课后答案.doc

  • 9页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。Amdahl定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。虚拟机(VirtualMachine):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。试比较这两种方法哪一种更好些。答:增加硬件的方法的加速比,另一种方法的加速比,经计算可知Sp1>Sp2第一种方法更好些。9、假设高 速缓存Cache的工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache能使整个存储系统获得多高的加速比?答:加速比,其中tm=5tc,代入公式,得到加速比S=3.33。11、Flynn分类法的依据是什么,它与按“并行级”和“流水级”的分类方法有什么不同?答:Flynn分类法的依据是指令流和数据流多倍性概念进行分类的。而“并行级”和“流水级”的分类方法是根据子系统的并行程度及流水线处理程度进行分类的方法。13、计算机系统按功能划分,通常分为那几个层次,这种划分方法有什么意义?答:计算机系统按功能可划分成多层次结构,在传统机器级上是操作系统级、汇编语言级、高级语言级和应用语言级,在下面的是微程序机器级以及扩展级电子线路。这种划分方法的意义是:有助于理解各级语言的实质及实现,分层后,处在某一级虚拟机的程序员只需知道这一级的语言及虚拟机,至于这一级语言如何层次地经翻译或解释直到下面的实际机器级,则无需知道。习题二1、解释下列术语CPIMIPSMFLOPS基准测试程序性能算术平均值性能几何平均值2、衡量计算机性能的主要标准是什么?为什么它是最可靠的衡量标准?答:衡量计算机系统性能可采用各种尺度,最常用的是时间和速率,但最为可靠的衡量尺度是时间。例如响应时间、CPU时间等。由于系统CPU时间很难精确统计,误差较大,故采用用户CPU时间作为衡量时间比较妥当。但在衡量无负载系统时,采用响应时间比较合适。用时间来作为计算机的衡量标准直观、准确,适用于各种情况的衡量,所以时间是最可靠的衡量标准。 3、4、计算机持续性能的表示常用哪3种平均值表示?列出他们的公式,并比较它们的优缺点。答:持续性能(SustainedPerformance)的表示常用算术平均(ArithmeticMean)、几何平均(GeometricMean)和调和平均(HarmonicMean)3种平均值方法,其计算公式如下:(1)算术性能平均值Am(2)几何性能平均值Gm(3)调和性能平均值Hm以上3个公式中Ri表示由n个程序组成的工作负荷中执行第i个程序的速率,Ti表示执行第i个程序所需的时间,这里Ri=1/Ti。三种方法中Am计算最简单,但不能精确地衡量性能。Gm运算量大,但它有一个良好的性能,即它的几何平均比和比的几何平均是相等的。在进行比较时是很方便的。Hm值是真正与运行所有典型测试程序所需时间总和成反比的,从时间是衡量性能唯一标准来看,用Hm值来衡量计算机系统性能是比较精确的。习题三1、解释下列术语带标志符的数据:带标志符数据表示(TaggedDataRepresentation)要求对每一个数据都附加标志符,由标志符来表示后边数据所具有的类型。数据描述符:数据描述符(DataDescriptors)主要是用来描述复杂和多维数据类型的,例如:向量、矩阵、记录等。 2、3、将下列数转换成IEEE单精度浮点格式,以8位十六进制数表示。(a)9IEEE单精度浮点格式为0x41100000(b)5/32IEEE单精度浮点格式为0x3E200000(c)-5/32IEEE单精度浮点格式为0xBE200000(d)6.125IEEE单精度浮点格式为0x40C400004、9、将下列的IEEE754单精度数由二进制数转换成十进制数。(1)11000001111000000000000000000000十进制数为:-7;(2)00111111010100000000000000000000十进制数为:0.8125(3)01000000000000000000000000000000十进制数为:110、11、IEEE745浮点数标准中,为什么要设置非规格化数?答:对于绝对值较小的数,为了避免下溢而损失精度,IEEE754标准允许采用比最小规格化数还要小的那些数,称为非规格化数(DenormalNumber)来表示,这是因为使用非规格化数后,就可以表示那些处于0和最小可表示的规格化数之间的数。习题四1、解释下列术语RISCCISC装载延迟 低端排序高端排序延迟转移技术重叠窗口技术4、某计算机有10条指令,它们的使用频率分别为:0.3、0.24、0.16、0.12、0.07、0.04、0.03、0.02、0.01、0.010.240.110.030.070.040.010.010.020.020.040.070.180.420.30.120.160.280.581.00若用霍夫曼编码对它们的操作码进行编码,其操作码的平均码长为多少?答:经编码后的霍夫曼树如图:(1111111)(1111110)(111110)(11110)(1110)(110)(10)(011)(010)(00)其平均编码长度=7*0.01+7*0.01+6*0.02+5*0.03+4*0.04+3*0.07+2*0.24+3*0.12+3*0.16+2*0.3=2.75、 6、某模型机有8条指令,使用频率分别为:0.3、0.3、0.2、0.1、0.05、0.02、0.02、0.01试分别用霍夫曼编码和扩展码对其操作码进行编码,限定扩展编码只有两种长度,则它们的平均编码长度各比定长操作码的平均编码长度减少多少?答:编码如下表:指令频率霍夫曼编码霍夫曼扩展编码定长编码10.3000000020.3010100130.2101001040.11101100001150.0511101100110060.02111101101010170.021111101101111080.0111111111100111平均指令长度2.382.63用霍夫曼编码要比定长编码平均长度减少0.62,用霍夫曼扩展编码要比定长编码平均长度减少0.4。7、8、试叙述比较-转移指令的功能特点,为什么在有的RISC机中要设置这样的指令?答:将比较指令和转移指令合成一条指令后,该指令将直接对两个对象进行相等或不等的比较,然后根据比较结果判别是否执行转移,这样就可以省去一条指令,且不用受条件码的约束。所以许多典型的RISC机中都采用这样的复合指令。 习题五1、解释下列术语:超长指令字机:(VLIW:VeryLongInstructionWord)以一条长指令(或一组指令形式)来实现每个时钟周期发动多个操作的并行执行,以减少对存储器的访问。超标量机:借助对硬件资源重复设置来实现空间的并行操作。超级流水机:通过提高流水线的运行速度来增强机器的性能,加深流水深度。2、3、假设一条指令的解释分为取指、分析和执行3个阶段,每个阶段所需的时间为t取指、t分析、和t执行。写出用下列几种方式执行100条指令所需的时间通式:(1)写出用下列几种方式执行100条指令所需的时间通式:顺序执行。T=100(t取指+t分析+t执行)仅“执行k”、与“取指k+1”重叠。T=t取指1+100t分析+仅“执行k”、“分析k+1”和“取指k+2”重叠。T=t取指1+t执行100+max{t取指2,t分析1}+max{t分析100+t执行99}+(2)当t取指=t分析=2,t执行=3以及t取指=t执行=4,t分析=2时,用上述通式计算所需的时间。答:(1)T=100*7=700T=2+100*3+99*3=599T=2+3+2+3+98*3=304(2)T=10*100=1000T=4+2*100+99*4=600T=4+4+4+4+98*4=4086、17、比较阻塞、交叉和同时多线程三者各自的优缺点。答: 在阻塞多线程超标量处理器中,长的阻塞可借助切换到另一线程而得到部分隐藏。虽然这种方式在每个时钟周期能减少完全闲置的时钟周期的数目,但由于有限的指令级并行性仍将导致闲置周期。对于交叉多线程的超标量处理器,由于各线程的交叉运行,从而可消除完全空闲的指令发射槽。但因为在指定的时钟周期中,仅有一个线程发射指令,所以悠闲地指令级并行性仍将导致在各个时钟周期内会有一定数量的闲置发射槽。在同时多线程的超标量处理器中,线程级并行性和指令级并行性被同时开发,因此在单个时钟周期中,各个指令发射槽可被多个线程使用。在理想情况下,指令发射槽的闲置数主要受多线程间所需的资源及可用资源间的不平衡约束。习题六1、解释下列术语:向量流水处理:允许流水线具有较深的流水深度,每条指令相当于一个标量循环,可以交叉访问的处理结构。屏蔽向量:通过向量测试得到的,采用屏蔽控制技术来控制那些向量元素参加运算,使循环能够向量化。半性能向量长度:为达到向量流水线最大性能值一半时所需要的向量长度。2、3、4、向量的加工方法有哪几种,各有什么特点?试从加工速度、需用中间变量等方面加以比较。答:向量的加工方法有三种:(1)横向加工(2)垂直加工(3)纵横向加工或称为分组加工。横向加工用到一个暂存单元,出现N次相关和2N次功能转换。垂直加工一次相关一次切换,但要一个中间暂存向量。横向加工各组有一次数据相关,2次切换,n个中间向量寄存器单元。习题七1、解释下列术语:直接映射全相联映射组相联映射 虚拟存储器全写法写回法SAN2、3、4、5、习题八1、2、4、5、6、10'