哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第一章 并行计算机模型 1.2 多处理机和多计算机 1.3 多向量机和SIMD计算机

第一章并行计犷机模 1计算技术的现状 2多处理机和多计算机 23多向量机和S|MD计算机 4并行计算机的抽象模型 25可扩展的范围和设计
2 第一章 并行计算机模型 ◼ 1 计算技术的现状 ◼2 多处理机和多计算机 ◼ 3 多向量机和SIMD计算机 ◼ 4 并行计算机的抽象模型 ◼ 5 可扩展的范围和设计

2多处理机和多计算机 、共享存储型多处理机 1.UMA模型 UMA--Uni form Memory Access 结构和特点:
3 2 多处理机和多计算机 ◼ 一、共享存储型多处理机 ◼ 1. UMA模型 ◼ UMA --Uniform Memory Access ◼ 结构和特点:

处理机 系统互连 (总线,交叉开关,多级网络) SM SMm 共享存储器 UMA多处理机模型
4

紧耦合系统( tightly coup led system a多处理机由于高度资源共享 口系统的互连采用总线、交叉开关、或多 级网络形式 对称( symmetric)多处理机 a当所有处理机都能同样访问所有外 围设备时
5 ◼ 紧耦合系统(tightly coupled system) ❑ 多处理机由于高度资源共享 ❑ 系统的互连采用总线、交叉开关、或多 级网络形式 ◼对称(symmetric)多处理机 ❑当所有处理机都能同样访问所有外 围设备时

例 Fortran程序可在单处理机上顺序执 行,分析0PU的运行时间,假设条件: 所有数组A(),B(1),G(1)都有N个 元素; 分析:求和 Fortran程序
6 ◼ 例 Fortran程序可在单处理机上顺序执 行,分析CPU的运行时间,假设条件: ◼ 所有数组A(I),B(I),C(I)都有N个 元素; ◼ 分析:求和Fortran程序

L1: Do 10I=1, N L2:A(I)=B(I)+c() L3: 10 Continue L4: SUM=0 L5: Do 20J=1, N L6: SUM=SUM+A(J) L7: 20 Continue 假定取指令和加载数据的开销可以忽略不 计 口所有数组已经装人主存储器,并且短程序段 已经装入高速缓冲存储器。 忽略总线争用或存储器存取冲突问题
7 ◼ L1: Do 10 I=1,N ◼ L2: A(I)=B(I)+C(I) ◼ L3:10 Continue ◼ L4: SUM=0 ◼ L5: Do 20 J=1,N ◼ L6: SUM=SUM+A(J) ◼ L7:20 Continue ◼ 假定取指令和加载数据的开销可以忽略不 计; ❑ 所有数组已经装人主存储器,并且短程序段 已经装入高速缓冲存储器。 ◼ 忽略总线争用或存储器存取冲突问题

再假设: 执行代码行L2,L4和L6,每行要用一个 机器周期。 执行程序控制语句L1,L3,L5和L7所需 的时间可以忽略。 假定经过共享存储器的处理机之间的每 次通信操作需要k个周期。 结论:CPU用2N个周期
8 ◼再假设: ◼ 执行代码行L2,L4和L6,每行要用一个 机器周期。 ◼ 执行程序控制语句L1,L3,L5和L7所需 的时间可以忽略。 ◼ 假定经过共享存储器的处理机之间的每 次通信操作需要k个周期。 ◼结论:CPU用2N个周期

串行程序并行化 在M一处理机系统上执行程序 口将循环操作划分成M段,每段有 L=N/M个元素 口假设经过共享存储器的处理机 之间的每次通信操作需要 k个周期
9 串行程序并行化 ◼在M—处理机系统上执行程序 ❑将循环操作划分成M段,每段有 L=N/M个元素。 ❑假设经过共享存储器的处理机 之间的每次通信操作需要: ◼ k个周期

Doa||表示所有M段在M台处理机上 并行执行 Doall k=1. m Do 10I=L(k-1)+1, kLo A(=B(+C( 10 Continue SUM(K=0 Do 20J=1. L SUM(K=SUM(K)+ A(L(k-1)+J 20 Continue 口 ENDall 10
10 ◼ Doall表示所有M段在M台处理机上 并行执行 ◼ Doall k=1,M ◼ Do 10 I=L(k-1)+1,kL。 ◼ A(I)=B(I)+C(I) ◼ 10 Continue ◼ SUM(k)=0 ◼ Do 20 J=1,L ◼ SUM(k) = SUM(k) + A(L(k-1)+ J) ◼ 20 Continue ◼ ENDall

分析: 口循环1是L个周期;循环2是L个周期 口总时间: 2L+h(k+1)=2NM+(k+1)|og2M
11 ◼ 分析: ❑ 循环1是L个周期;循环2是L个周期 ❑ 总时间: ◼ 2L+ h(k+1)=2N/M+(k+1) log2M
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第一章 并行计算机模型(1.1)计算技术的现状(季振洲).ppt
- 四川职业技术学院:《数据库基础》模块五 数据查询.ppt
- 四川职业技术学院:《数据库基础》模块六 视图及数据库管理.ppt
- 四川职业技术学院:《数据库基础》模块三 表的建立与维护.ppt
- 四川职业技术学院:《数据库基础》模块四 表记录的维护.ppt
- 四川职业技术学院:《数据库基础》模块二 数据库建立与维护.ppt
- 四川职业技术学院:《数据库基础》模块一 基础知识.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第9章 输入/输出程序设计.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第8章 高级语言汇编技术.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第7章 非数值运算.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第6章 子程序设计及系统调用.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第5章 程序设计基础技术.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第4章 汇编语言与源程序结构.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第3章 指令系统和寻址方式.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第2章 IBM PC计算机系统结构.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第1章 基础知识.ppt
- 《汇编语言程序设计》课程教学资源(PPT课件讲稿)第10章 模块化程序设计.ppt
- 《C程序设计语言》课程PPT教学课件(讲稿)第三章 运算符与表达式.ppt
- 《C程序设计语言》课程PPT教学课件(讲稿)复习.ppt
- 《C程序设计语言》课程PPT教学课件(讲稿)第九章 循环程序设计.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第一章 并行计算机模型(1.4)并行计算机的抽象模型.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第一章 并行计算机模型(1.5)可扩展的范围和设计.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第一章 并行计算机模型(1.5)可扩展的范围和设计.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第二章 并行编程基础(2.1)并行编程综述.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第二章 并行编程基础(2.2)进程任务和线程.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第二章 并行编程基础(2.3)并行性问题.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第二章 并行编程基础(2.4)通信问题.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.1)系统和应用的基准程序.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.2)性能和成本.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.3)基本性能指标.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.4)并行计算机性能.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.5)并行程序性能.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.6)可扩展性和加速比分析.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第四章 处理器构件.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第五章 分布式存储器及其时延容忍(5.1)层次存储器技术.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第五章 分布式存储器及其时延容忍(5.2)高缓一致性协议.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第五章 分布式存储器及其时延容忍(5.3)共享存储器的同一性.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第五章 分布式存储器及其时延容忍(5.4)分布式高速缓存/主存体系结构.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第六章 系统的互联和千兆位网络 6.1 系统互连基础 6.2 静态连接网络.ppt
- 哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第六章 系统的互联和千兆位网络(6.3)动态连接网络.ppt