四、简单应用题(本大题共2小题,每小题10分,共20分) 26.求向量D=A*(B+C),各向量元素个数均为6,参照CRAY-1方式分解为3条向量指令:
①
←存储器 {访存取A送入 寄存器组}
②
← {B+C→K}
③
← * {K*A→D}
当采用下列2种方式工作时各需多少拍才能得到全部结果?
(1)①和②并行执行完后,再执行③;
(2)采用链接技术。
(注:CRAY-1方式启动访存1拍,访存6拍,打入寄存器组1拍,加法6拍,乘7拍)
27.Cache-主存存储层次中,主存有0~7共8块,Cache为4块,采用组相联映象。假设Cache已先后访问并预取进了主存的第5、1、3、7块,现访存地址流又为1、2、4、1、3、7、0、1、2、5、4、6时:
(1)画出用LRU替换算法,Cache内各块的实际替换过程图,并标出命中时刻,其中Cache分为两组。
(2)求出在此期间的Cache命中率。
五、综合应用题(本大题共2小题,每小题10分,共20分)
28.(1)要将浮点数尾数下溢处理成K—1位结果,则ROM表的单元数和字长各是多少?并简述ROM表各单元所填的内容与其地址之间的规则。
(2)若3位数,其最低位为下溢处理前的附加位,现将其下溢处理成2位结果,设计使下溢处理平均误差接近于零的ROM表,以表明地址单元与其内容的关系。
29.并行处理机有16个处理单元,若用STARAN网互连,
(1)画出4级立方体互连网络拓扑结构图;
(2)要实现2传给F,标出各级交换开关的状态。