《并行计算》课程教学资源(讲义)测验习题3

名词解释 请给出下列缩写的全称,并加以解释 MPP、PCAM、 APRAM 2.请简要解释下列术语的含义。 共享变量模型、NUMA、加速比、logP 二、问答题 1.现在市场上常见的双CPU的计算机采用的是什么结构?简述该结构的特性。 2.何谓高速缓存一致性问题?请简述一致性维护的基本策略。 3.请简述并举例说明 Amdahl定律 4.请问如何将一个MPMD程序改写为SPMD程序? 、综合题 1.阅读以下题为“占据半壁江山IBM继续统治超级计算机排行榜”大众新闻报道,回 答问题 根据超级计算机500强组织最近发布的调査报告,IBM继续在超级计算机领域处于绝对的统 治地位。此调査每半年进行一次,这是自1993年以来的第26次调查。 目前,世界上500台最强悍的超级计算机中有219台属于IBM,其中前三名更是全部出自IBM 之手。位列第二的HP拥有16台。位列榜首的依旧是大名鼎鼎的蓝色基因一— Blue gene/L,运 算速度为每秒280.6万亿次浮点运算。这一速度不久前刚刚刷新了世界记录。这台超级计算机是 为美国国家核安全局打造的,主要用于模拟核试验。紧随其后的也是蓝色基因,不过是IBM自 己的 Watson Blue Gene(WBG)系统,运算速度为每秒91.29万亿次浮点运算。第三名是位于劳伦 斯-利沃莫尔国家实验室的 ASC Purple,运算速度为每秒63.39万亿次浮点运算。IBM这219台超 级计算机的总运算速度为每秒1.214千万亿次浮点运算,占500强总运算能力的53%,远远甩开 了竞争对手。这是第一次一家公司的总速度突破千万亿次大关。 IBM将自己成功的原因归结于富有弹性的操作平台和强大的 Power处理器等因素,其中蓝色 基因使用的就是 Power处理器。 (1)请问文中提到的“排行榜”是按照什么方法对高性能计算机进行排序的?这种方法 具有什么样的优点和不足? (2)结合文中提到的髙性能计算的应用,谈谈为什么中国需要自行硏制高性能计算机, 并请举出两种国产系列高性能计算机品牌 (3)结合课程所学知识,请对文中“IBM将自己成功的原因归结于富有弹性的操作平 台和强大的 Power处理器等因素”进行分析评论。 2.假定A4和B4已加载到如下所示的4×4处理器阵列上,试用图表示 Cannon矩阵乘 法的具体过程
- 1 - 一、 名词解释 1. 请给出下列缩写的全称,并加以解释。 MPP、PCAM、APRAM 2.请简要解释下列术语的含义。 共享变量模型、NUMA、加速比、logP 二、 问答题 1.现在市场上常见的双 CPU 的计算机采用的是什么结构?简述该结构的特性。 2.何谓高速缓存一致性问题?请简述一致性维护的基本策略。 3.请简述并举例说明 Amdahl 定律。 4.请问如何将一个 MPMD 程序改写为 SPMD 程序? 三、 综合题 1.阅读以下题为“占据半壁江山 IBM 继续统治超级计算机排行榜”大众新闻报道,回 答问题。 根据超级计算机 500 强组织最近发布的调查报告,IBM 继续在超级计算机领域处于绝对的统 治地位。此调查每半年进行一次,这是自 1993 年以来的第 26 次调查。 目前,世界上500台最强悍的超级计算机中有219台属于IBM,其中前三名更是全部出自IBM 之手。位列第二的 HP 拥有 169 台。位列榜首的依旧是大名鼎鼎的蓝色基因——Blue Gene/L,运 算速度为每秒 280.6 万亿次浮点运算。这一速度不久前刚刚刷新了世界记录。这台超级计算机是 为美国国家核安全局打造的,主要用于模拟核试验。紧随其后的也是蓝色基因,不过是 IBM 自 己的 Watson Blue Gene(WBG)系统,运算速度为每秒 91.29 万亿次浮点运算。第三名是位于劳伦 斯-利沃莫尔国家实验室的 ASC Purple,运算速度为每秒 63.39 万亿次浮点运算。IBM 这 219 台超 级计算机的总运算速度为每秒 1.214 千万亿次浮点运算,占 500 强总运算能力的 53%,远远甩开 了竞争对手。这是第一次一家公司的总速度突破千万亿次大关。 IBM 将自己成功的原因归结于富有弹性的操作平台和强大的 Power 处理器等因素,其中蓝色 基因使用的就是 Power 处理器。 (1)请问文中提到的“排行榜”是按照什么方法对高性能计算机进行排序的?这种方法 具有什么样的优点和不足? (2)结合文中提到的高性能计算的应用,谈谈为什么中国需要自行研制高性能计算机, 并请举出两种国产系列高性能计算机品牌。 (3)结合课程所学知识,请对文中 “IBM 将自己成功的原因归结于富有弹性的操作平 台和强大的 Power 处理器等因素”进行分析评论。 2.假定 A44 和 B44 已加载到如下所示的 4 4 处理器阵列上,试用图表示 Cannon 矩阵乘 法的具体过程

A Ao.A A B,o Bo, 1 Bo. 2 B A1.o A1. A1.2A B B.1B12B1,3 A A2. 2A2 B20B21B22B2.3 A.。Aa.1A32|A3.3 B30B31B32B3.3 3.MMD机器上PSRS排序算法描述如下: 输入:长度为n的无序序列,P台处理器,每台处理器有m/p个元素 输出:长度为n的有序序列 n (1)均匀划分:n个元素均匀地划分成p段,每台处理器有m个元素。 (2)局部排序:各个处理器利用串行排序算法,排序m个数。 (3)选择样本:每台处理器各从自己的有序段中选取p个样本元素 (4)样本排序:用一台处理器将所有p2个样本元素用串行排序算法排序之 (5)选择主元:用一台处理器选取p-1个主元,并将其播送给其余处理器。 (6)主元划分:各处理器按主元将各自的有序段划分成p段 (7)全局交换:各处理器将其辖段按段号交换到相应的处理器。 (8)归并排序:处理器使用归并排序将所接收的诸段施行排序 ①试证明:当n≥p3时,上述算法的时间复杂度为O("logn) 令w表示P中第j段中的元素数,试证明上述算法在执行过程中,处理器中所积累 的元素数目不会超过21p,即∑< 4.PRAM上对数划分算法描述如下: 输入:两非降有序序列A=(a1y…,an),B=(b,…,bn),假定kogm和k(m)=m/ogm均为整数 输出:将A和B划分成(m)对段组(4,B),使得|B=gm,∑|4|=n,且对于所 有1≤i≤k(m)-1,A和B中的每一个i元素均大于4和B中的每一个元素 (1)j(0)=0;j(k(m)=n
- 2 - 0,0 1,0 2,0 3,0 0,1 1,1 2,1 3,1 0,2 1,2 2,2 3,2 0,3 1,3 2,3 3,3 0,0 1,0 2,0 3,0 0,1 1,1 2,1 3,1 0,2 1,2 2,2 3,2 0,3 1,3 2,3 3,3 A A A A B B B B A A A A B B B B A A A A B B B B A A A A B B B B 3.MIMD 机器上 PSRS 排序算法描述如下: 输入:长度为 n 的无序序列,p 台处理器,每台处理器有 n p 个元素 输出:长度为 n 的有序序列 Begin (1) 均匀划分:n 个元素均匀地划分成 p 段,每台处理器有 n/p 个元素。 (2) 局部排序:各个处理器利用串行排序算法,排序 n/p 个数。 (3) 选择样本:每台处理器各从自己的有序段中选取 p 个样本元素。 (4) 样本排序:用一台处理器将所有 p 2 个样本元素用串行排序算法排序之。 (5) 选择主元:用一台处理器选取 p-1 个主元,并将其播送给其余处理器。 (6) 主元划分:各处理器按主元将各自的有序段划分成 p 段。 (7) 全局交换:各处理器将其辖段按段号交换到相应的处理器。 (8) 归并排序:处理器使用归并排序将所接收的诸段施行排序。 End ① 试证明:当 3 n p 时,上述算法的时间复杂度为 ( log ) n O n p 。 ② 令 j wi 表示 Pi 中第 j 段中的元素数,试证明上述算法在执行过程中,处理器中所积累 的元素数目不会超过 2 / n p ,即 1 2 p j i j n w = p 。 4.PRAM 上对数划分算法描述如下: 输入:两非降有序序列 ( ,..., ) A = a1 an , ( ,..., ) B = b1 bn ,假定 log m 和 k(m) = m log m 均为整数 输出:将 A 和 B 划分成 k(m) 对段组 ( , ) Ai Bi ,使得 | Bi |= log m,| Ai | = n ,且对于所 有 1 i k(m) −1, Ai 和 Bi 中的每一个 i 元素均大于 Ai−1 和 Bi−1 中的每一个元素 Begin (1) j(0) = 0 ; j(k(m)) = n

(2)for i=l to k(m)-1 par-do (2.1)求rank( b:A) (2.2)j()=ramk(b end for (3)for i=0 to k(m)-1 par-do (3.1)B=(bm4 (3.2)A=(a (1)+1…,aJ(i+1) End ①试分析上述算法的时间复杂度。 令A=(0,1,2,7,9,116,17,18,19,23,24,25,27,28,30,33,34) B=(3,4,5,6,8,10,12,13,14,15,20,21,22,26,29,31)。 按上述算法,将其进行对数划分,并最终将它们归并
- 3 - (2) for i =1 to k(m) −1 par-do (2.1)求 ( : ) rank bilogm A (2.2) ( ) ( : ) j i = rank bilogm A end for (3) for i = 0 to k(m) −1 par-do (3.1) ( ,..., ) Bi = bilogm+1 b(i+1)logm (3.2) ( ,..., ) Ai = a j(i)+1 a j(i+1) end for End ① 试分析上述算法的时间复杂度。 ② 令 A = (0,1,2,7,9,11,16,17,18,19,23,24,25,27,28,30,33,34) B = (3,4,5,6,8,10,12,13,14,15,20,21,22,26,29,31) 。 按上述算法,将其进行对数划分,并最终将它们归并
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《并行计算》课程教学资源(讲义)测验习题2.doc
- 《并行计算》课程教学资源(讲义)测验习题1.doc
- 《并行计算》课程教学资源(讲义)第十五章 并行程序设计环境与工具.doc
- 《并行计算》课程教学资源(讲义)第十四章 分布存储系统并行编程.doc
- 《并行计算》课程教学资源(讲义)第十三章 共享存储系统编程.doc
- 《并行计算》课程教学资源(讲义)第十二章 并行程序设计基础.doc
- 《并行计算》课程教学资源(讲义)第十一章 快速傅里叶变换.doc
- 《并行计算》课程教学资源(讲义)第十章 线性方程组的求解.doc
- 《并行计算》课程教学资源(讲义)第九章 稠密矩阵运算.doc
- 《并行计算》课程教学资源(讲义)第八章 基本通讯操作.doc
- 《并行计算》课程教学资源(讲义)第七章 并行算法的一般设计过程.doc
- 《并行计算》课程教学资源(讲义)第六章 并行算法的基本设计技术.doc
- 《并行计算》课程教学资源(讲义)第五章 并行算法的一般设计方法.doc
- 《并行计算》课程教学资源(讲义)第四章 并行算法的设计基础.doc
- 《并行计算》课程教学资源(讲义)第三章 并行计算性能评测.doc
- 《并行计算》课程教学资源(讲义)第二章 当代并行机系统介绍.doc
- 《并行计算》课程教学资源(讲义)第一章 并行计算机系统及其结构模型.doc
- 宜宾职业技术学院:《办公自动化》课程教学资源_第五章习题.doc
- 宜宾职业技术学院:《办公自动化》课程教学资源_习题五.doc
- 宜宾职业技术学院:《办公自动化》课程教学资源_习题四.doc
- 《并行计算》课程教学资源(讲义)例题习题讲解.doc
- 《并行计算》课程教学资源(讲义)各章小结.doc
- 《并行计算》课程教学资源(讲义)排序.doc
- 《并行计算》课程教学资源(讲义)串匹配.doc
- 《并行计算》课程教学资源(讲义)图论.doc
- 《并行计算》课程教学资源(讲义)组合优化.doc
- 《并行计算》课程教学资源(讲义)计算几何.doc
- 《并行计算》课程教学资源(讲义)矩阵运算.doc
- 《并行计算》课程教学资源(讲义)线性方程组的直接解法.doc
- 《并行计算》课程教学资源(讲义)线性方程组的迭代解法.doc
- 《并行计算》课程教学资源(讲义)矩阵特征值计算.doc
- 《并行计算》课程教学资源(讲义)快速傅氏变换和离散小波变换.doc
- 《并行计算》课程教学资源(讲义)搭建机群系统指导说明.doc
- 哈尔滨工业大学:《计算机图形学》第7章 真实感图形显示(二).ppt
- 哈尔滨工业大学:《计算机图形学》第8章 颜色科学基础及其应用.ppt
- 哈尔滨工业大学:《计算机图形学》第7章 真实感图形显示(一).ppt
- 哈尔滨工业大学:《计算机图形学》第5章 图形变换与裁剪 5.1 窗口视图变换 5.2 二维图形几何变换.ppt
- 哈尔滨工业大学:《计算机图形学》第4章 自由曲线与曲面(一).ppt
- 哈尔滨工业大学:《计算机图形学》第4章 自由曲线与曲面(二).ppt
- 哈尔滨工业大学:《计算机图形学》第1章 图形学绪论.ppt