中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(试卷)并行分布式试卷(三)

名词解释 请给出下列缩写的全称,并加以解释。 MPP、PCAM、 APRAM 2.请简要解释下列术语的含义。 共享变量模型、NUMA、加速比、logP 二、问答题 1.现在市场上常见的双CPU的计算机采用的是什么结构?简述该结构的特性。 2.何谓高速缓存一致性问题?请简述一致性维护的基本策略。 3.请简述并举例说明 Amdahl定律 4.请问如何将一个MPMD程序改写为SPMD程序? 、综合题 1.阅读以下题为“占据半壁江山IBM继续统治超级计算机排行榜”大众新闻报道,回 答问题 根据超级计算机500强组织最近发布的调查报告,IBM继续在超级计算机领域处于绝对的统 治地位。此调査每半年进行一次,这是自1993年以来的第26次调查。 目前,世界上500台最强悍的超级计算机中有219台属于IBM,其中前三名更是全部出自IBM 之手。位列第二的HP拥有169台。位列榜首的依旧是大名鼎鼎的蓝色基因一— Blue Gene/L,运 算速度为每秒280.6万亿次浮点运算。这一速度不久前刚刚刷新了世界记录。这台超级计算机是 为美国国家核安全局打造的,主要用于模拟核试验。紧随其后的也是蓝色基因,不过是IBM自 己的 Watson Blue Gene(WBG)系统,运算速度为每秒91.29万亿次浮点运算。第三名是位于劳伦 斯-利沃莫尔国家实验室的 ASC Purple,运算速度为每秒63.39万亿次浮点运算。IBM这219台超 级计算机的总运算速度为每秒1.214千万亿次浮点运算,占500强总运算能力的53%,远远甩开 了竞争对手。这是第一次一家公司的总速度突破千万亿次大关。 IBM将自己成功的原因归结于富有弹性的操作平台和强大的 Power处理器等因素,其中蓝色 基因使用的就是 Power处理器。 (1)请问文中提到的“排行榜”是按照什么方法对高性能计算机进行排序的?这种方法 具有什么样的优点和不足? (2)结合文中提到的髙性能计算的应用,谈谈为什么中国需要自行硏制高性能计算机, 并请举出两种国产系列高性能计算机品牌 (3)结合课程所学知识,请对文中“IBM将自己成功的原因归结于富有弹性的操作平 台和强大的 Power处理器等因素”进行分析评论。 2.假定A4和B4已加载到如下所示的4×4处理器阵列上,试用图表示 Cannon矩阵乘 法的具体过程
- 1 - 一、 名词解释 1. 请给出下列缩写的全称,并加以解释。 MPP、PCAM、APRAM 2.请简要解释下列术语的含义。 共享变量模型、NUMA、加速比、logP 二、 问答题 1.现在市场上常见的双 CPU 的计算机采用的是什么结构?简述该结构的特性。 2.何谓高速缓存一致性问题?请简述一致性维护的基本策略。 3.请简述并举例说明 Amdahl 定律。 4.请问如何将一个 MPMD 程序改写为 SPMD 程序? 三、 综合题 1.阅读以下题为“占据半壁江山 IBM 继续统治超级计算机排行榜”大众新闻报道,回 答问题。 根据超级计算机 500 强组织最近发布的调查报告,IBM 继续在超级计算机领域处于绝对的统 治地位。此调查每半年进行一次,这是自 1993 年以来的第 26 次调查。 目前,世界上500台最强悍的超级计算机中有219台属于IBM,其中前三名更是全部出自IBM 之手。位列第二的 HP 拥有 169 台。位列榜首的依旧是大名鼎鼎的蓝色基因——Blue Gene/L,运 算速度为每秒 280.6 万亿次浮点运算。这一速度不久前刚刚刷新了世界记录。这台超级计算机是 为美国国家核安全局打造的,主要用于模拟核试验。紧随其后的也是蓝色基因,不过是 IBM 自 己的 Watson Blue Gene(WBG)系统,运算速度为每秒 91.29 万亿次浮点运算。第三名是位于劳伦 斯-利沃莫尔国家实验室的 ASC Purple,运算速度为每秒 63.39 万亿次浮点运算。IBM 这 219 台超 级计算机的总运算速度为每秒 1.214 千万亿次浮点运算,占 500 强总运算能力的 53%,远远甩开 了竞争对手。这是第一次一家公司的总速度突破千万亿次大关。 IBM 将自己成功的原因归结于富有弹性的操作平台和强大的 Power 处理器等因素,其中蓝色 基因使用的就是 Power 处理器。 (1)请问文中提到的“排行榜”是按照什么方法对高性能计算机进行排序的?这种方法 具有什么样的优点和不足? (2)结合文中提到的高性能计算的应用,谈谈为什么中国需要自行研制高性能计算机, 并请举出两种国产系列高性能计算机品牌。 (3)结合课程所学知识,请对文中 “IBM 将自己成功的原因归结于富有弹性的操作平 台和强大的 Power 处理器等因素”进行分析评论。 2.假定 A44 和 B44 已加载到如下所示的 4 4 处理器阵列上,试用图表示 Cannon 矩阵乘 法的具体过程

A Ao.A A B,o Bo, 1 Bo. 2 B A1.o A1. A1.2A B B.1B12B1,3 A A2. 2A2 B20B21B22B2.3 A.。Aa.1A32|A3.3 B30B31B32B3.3 3.MMD机器上PSRS排序算法描述如下: 输入:长度为n的无序序列,P台处理器,每台处理器有m/p个元素 输出:长度为n的有序序列 n (1)均匀划分:n个元素均匀地划分成p段,每台处理器有m个元素。 (2)局部排序:各个处理器利用串行排序算法,排序m个数。 (3)选择样本:每台处理器各从自己的有序段中选取p个样本元素 (4)样本排序:用一台处理器将所有p2个样本元素用串行排序算法排序之 (5)选择主元:用一台处理器选取p-1个主元,并将其播送给其余处理器。 (6)主元划分:各处理器按主元将各自的有序段划分成p段 (7)全局交换:各处理器将其辖段按段号交换到相应的处理器。 (8)归并排序:处理器使用归并排序将所接收的诸段施行排序 ①试证明:当n≥p3时,上述算法的时间复杂度为O("1ogn) 令w表示P中第j段中的元素数,试证明上述算法在执行过程中,处理器中所积累 的元素数目不会超过2n/p,即∑v< 4.PRAM上对数划分算法描述如下: 输入:两非降有序序列A=(a12…,an),B=(b1…,bn),假定ogm和k(m)=m/kogm均为整数 输出:将A和B划分成(m)对段组(A,B),使得|B=lgm,∑|4|=n,且对于所 有1≤i≤k(m)-1,A和B中的每一个i元素均大于41和B中的每一个元素 (1)f(O)=0;j(k(m)=n
- 2 - 0,0 1,0 2,0 3,0 0,1 1,1 2,1 3,1 0,2 1,2 2,2 3,2 0,3 1,3 2,3 3,3 0,0 1,0 2,0 3,0 0,1 1,1 2,1 3,1 0,2 1,2 2,2 3,2 0,3 1,3 2,3 3,3 A A A A B B B B A A A A B B B B A A A A B B B B A A A A B B B B 3.MIMD 机器上 PSRS 排序算法描述如下: 输入:长度为 n 的无序序列,p 台处理器,每台处理器有 n p 个元素 输出:长度为 n 的有序序列 Begin (1) 均匀划分:n 个元素均匀地划分成 p 段,每台处理器有 n/p 个元素。 (2) 局部排序:各个处理器利用串行排序算法,排序 n/p 个数。 (3) 选择样本:每台处理器各从自己的有序段中选取 p 个样本元素。 (4) 样本排序:用一台处理器将所有 p 2 个样本元素用串行排序算法排序之。 (5) 选择主元:用一台处理器选取 p-1 个主元,并将其播送给其余处理器。 (6) 主元划分:各处理器按主元将各自的有序段划分成 p 段。 (7) 全局交换:各处理器将其辖段按段号交换到相应的处理器。 (8) 归并排序:处理器使用归并排序将所接收的诸段施行排序。 End ① 试证明:当 3 n p 时,上述算法的时间复杂度为 ( log ) n O n p 。 ② 令 j wi 表示 Pi 中第 j 段中的元素数,试证明上述算法在执行过程中,处理器中所积累 的元素数目不会超过 2 / n p ,即 1 2 p j i j n w = p 。 4.PRAM 上对数划分算法描述如下: 输入:两非降有序序列 ( ,..., ) A = a1 an , ( ,..., ) B = b1 bn ,假定 log m 和 k(m) = m log m 均为整数 输出:将 A 和 B 划分成 k(m) 对段组 ( , ) Ai Bi ,使得 | Bi |= log m,| Ai | = n ,且对于所 有 1 i k(m) −1, Ai 和 Bi 中的每一个 i 元素均大于 Ai−1 和 Bi−1 中的每一个元素 Begin (1) j(0) = 0 ; j(k(m)) = n

(2)for i=l to k(m)-1 par-do (2.1)求rank(bogm:A) (2.2) j(i)=rank(blog A) end for (3)for i=0 to k(m)-1 par-do (3.1)B=(bm4…b (3.2)A=(a End ①试分析上述算法的时间复杂度。 令A=(0,1,2,7,9,116,17,18,19,23,24,25,27,28,30,33,34) B=(3,4,5,6,8,10,12,13,14,15,20,21,22,26,29,31)。 按上述算法,将其进行对数划分,并最终将它们归并
- 3 - (2) for i =1 to k(m) −1 par-do (2.1)求 ( : ) rank bilogm A (2.2) ( ) ( : ) j i = rank bilogm A end for (3) for i = 0 to k(m) −1 par-do (3.1) ( ,..., ) Bi = bilogm+1 b(i+1)logm (3.2) ( ,..., ) Ai = a j(i)+1 a j(i+1) end for End ① 试分析上述算法的时间复杂度。 ② 令 A = (0,1,2,7,9,11,16,17,18,19,23,24,25,27,28,30,33,34) B = (3,4,5,6,8,10,12,13,14,15,20,21,22,26,29,31) 。 按上述算法,将其进行对数划分,并最终将它们归并
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(试卷)并行分布式试卷(二).doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(试卷)并行分布式试卷(一).doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源_Part III Parallel Programming Models.pdf
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源_Part I Parallel Computer System Architectures.pdf
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第1章 计算机网络概论(杜煜).ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第9章 Internet及其相关内容.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第2章 数据通信技术的基础知识.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第8章 网络的互连.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第4章 计算机局域网络.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第10章 计算机网络安全.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第7章 网络的计算模式.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第3章 计算机网络体系结构.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第5章 结构化布线系统.ppt
- 高职高专规划教材:《计算机网络基础》课程教学资源(PPT课件)第6章 网络操作系统与网络结构.ppt
- 中国计量大学(中国计量学院):《现场总线技术》课程教学资源(PPT课件)第四课 现场总线的发展趋势.ppt
- 中国计量大学(中国计量学院):《现场总线技术》课程教学资源(PPT课件)第三课 主要现场总线与现场总线控制系统.ppt
- 中国计量大学(中国计量学院):《现场总线技术》课程教学资源(PPT课件)第二课 现场总线简介.ppt
- 中国计量大学(中国计量学院):《现场总线技术》课程教学资源(PPT课件)第一课 计算机网络(概述).ppt
- 《管理信息系统》课程教学资源:PPT课件讲稿(共三章,附案例).ppt
- 计算机应用与维护专业(单招)教学大纲(基础课程、技术课程、选修课).doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(讲义)各章小结.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(讲义)例题讲解.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第一章 并行计算机系统及其结构模型.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十章 线性方程组的求解.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十一章 快速傅里叶变换.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十二章 并行程序设计基础.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十三章 共享存储系统并行编程.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十四章 分布存储系统并行编程.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第十五章 并行程序设计环境与工具.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第二章 当代并行计算机系统介绍.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第三章 并行计算性能评测.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第四章 并行算法的设计基础.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第五章 并行算法的一般设计策略.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第六章 并行算法的基本设计技术.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第七章 并行算法的一般设计过程.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第八章 基本通信操作.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(习题)第九章 稠密矩阵运算.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(实验)并行计算PC机群的构建.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(实验)排序.doc
- 中国科学技术大学:《并行计算 Parallel Computing》课程教学资源(实验)快速傅氏变换和离散小波变换.doc