西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机系统结构(第二部分)

《并行计算:Parallel Computing.》 结构编程算法应用 §2.1并行计算机系统结构模型 (第二部分) 徐悦牲Yueshen Xu) ysxu@xidian.edu.cn 软件工程系 西安电子科技大学
§2.1 并行计算机系统结构模型 (第二部分) 徐悦甡(Yueshen Xu) ysxu@xidian.edu.cn 软件工程系 西安电子科技大学 《并行计算:Parallel Computing》 结构 编程 算法 应用

本节提纲 历些毛子科枚大》 XIDIAN UNIVERSITY ▣并行计算机访存模型 ■均匀存储访问与非均匀存储访问 ■高速缓存存储访问 从存储器的角度 ■非远程存储访问模型等 ■体系结构与访存模型的关系 ▣并行计算机性能测评 ■并行计算机的基本性能指标 讨论一部分 ■加速比性能测评 ■可扩展性性能测评
并行计算机访存模型 均匀存储访问与非均匀存储访问 高速缓存存储访问 非远程存储访问模型等 体系结构与访存模型的关系 本节提纲 从存储器的角度 并行计算机性能测评 并行计算机的基本性能指标 加速比性能测评 可扩展性性能测评 讨论一部分 2

上节课回顾 历粤毛子种枝大等 XIDIAN UNIVERSITY →并行计算机体系结构模型汇总 ▣各实现形式比对 P/C P/C MB P/C P/C 交叉开关 总线或交叉开关 LM NIC NIC SM SM SM SM SM I/O PVP SMP 定制网络 MB MB P/C P/O MB MB MPP P/C P/C LM M M Bridge DIR DIR Bridge OB 定制网络 商品网络(以太网,ATM,etc.) DSM Cow
上节课回顾 并行计算机体系结构模型汇总 VP SM 交叉开关 PVP VP VP SM SM P/C SM SM I/O 总线或交叉开关 SMP P/C P/C P/C LM NIC 定制网络 MPP P/C LM NIC MB MB P/C LM NIC DIR MB 定制网络 DSM P/C LM NIC DIR MB LD P/C M MB IOB COW LD P/C M MB IOB 商品网络(以太网,ATM,etc.) Bridge NIC NIC Bridge 各实现形式比对 5

并行计算机体系结构汇总 历些莞子种拔大多 XIDIAN UNIVERSITY ▣各并行计算机结构特性(比较) 属性 SIMD PVP SMP MPP DSM COW 同构性 SIMD MIMD MIMD MIMD MIMD MIMD 同步性 指令级 异步 异步 异步 异步 异步 同步 或弱同步 或弱同步 或弱同步 或弱同步 或弱同步 通信机制 数据并行 共享变量 共享变量 消息传递 共享变量 消息传递 地址空间 单空间 单空间 单空间 多空间 单空间 多空间 访存模型 UMA UMA UMA NORMA NUMA NORMA 互连网络 定制 交叉开关 总线或 交叉开关 定制 定制 商用 6
并行计算机体系结构汇总 属性 SIMD PVP SMP MPP DSM COW 同构性 SIMD MIMD MIMD MIMD MIMD MIMD 同步性 指令级 同步 异步 或弱同步 异步 或弱同步 异步 或弱同步 异步 或弱同步 异步 或弱同步 通信机制 数据并行 共享变量 共享变量 消息传递 共享变量 消息传递 地址空间 单空间 单空间 单空间 多空间 单空间 多空间 访存模型 UMA UMA UMA NORMA NUMA NORMA 互连网络 定制 交叉开关 总线或 交叉开关 定制 定制 商用 各并行计算机结构特性(比较) 6

并行计算机访存模型 历些毛子种枝大学 XIDIAN UNIVERSITY Vs.体系结构 口常见的并行计算机访存模型 UMA (Uniform Memory Access), 均匀存储访问模型 NUMA(Non-uniform Memory Access), 非均匀存储访问模型 五种常见 COMA(Cache-Only Memory Access), 的并行计 结构越来 全高速缓存存储访问 算机访存 越复杂 模型 CC-NUMA (Coherent-Cache Non- uniform Memory Access), 高速缓存一致性非均匀存储访问 NORMA (No-Remote Memory Access),非远程存储访问
并行计算机访存模型 常见的并行计算机访存模型 vs. 体系结构 五种常见 的并行计 算机访存 模型 UMA(Uniform Memory Access), 均匀存储访问模型 CC-NUMA(Coherent-Cache Nonuniform Memory Access), 高速缓存一致性非均匀存储访问 NUMA(Non-uniform Memory Access), 非均匀存储访问模型 COMA(Cache-Only Memory Access), 全高速缓存存储访问 NORMA(No-Remote Memory Access),非远程存储访问 结构越来 越复杂 7

并行计算机访存模型 历些毛子科枝大》 XIDIAN UNIVERSITY UMA (Uniform Memory Access) ■均匀存储访问模型 处理器 P1 P2 系统互连 (总线,交叉开关,多级网络) l/0 SM1 SMm 共享存储器 ■物理存储器被所有处理器均匀共享 ■所有处理器访问任何存储所用时间相同 ■每台处理器可带私有高速缓存 8
并行计算机访存模型 UMA(Uniform Memory Access) 均匀存储访问模型 物理存储器被所有处理器均匀共享 P1 P2 Pn I/O SM1 SMm 共享存储器 处理器 ( ) 系统互连 总线 , 交叉开关 , 多级网络 8 所有处理器访问任何存储所用时间相同 每台处理器可带私有高速缓存

并行计算机访存模型 历些毛子种枝大等 XIDIAN UNIVERSITY NUMA(Non-uniform Memory Access) ■非均匀存储访问模型 >被共享的存储器在物理上分布在所有的处理器中,所有本地存储器的集合 组成了全局地址空间 >处理器访问存储器的时间不同 访问本地存储器LM或群内共享存储器CSM较快,而访问外地的存储器 或全局共享存储器GSM较慢 >此即非均匀存储访问名称的由来 LM GSM Global Shared Memory 互 CSM Cluster Shared Memory LM 连网 模型一,名词解释→ LM Local Memory LM P Processor 共享本地存储模型 9
并行计算机访存模型 NUMA(Non-uniform Memory Access) 非均匀存储访问模型 LM1 P1 LM2 P 2 LMn Pn 互 连 网 络 共享本地存储模型 ... ... 模型一,名词解释 LM = Local Memory P = Processor ➢ 处理器访问存储器的时间不同 - 访问本地存储器LM或群内共享存储器CSM较快,而访问外地的存储器 或全局共享存储器GSM较慢 GSM = Global Shared Memory CSM = Cluster Shared Memory 9 ➢ 此即非均匀存储访问名称的由来 ➢ 被共享的存储器在物理上分布在所有的处理器中,所有本地存储器的集合 组成了全局地址空间

并行计算机访存模型 历些毛子件枝大 XIDIAN UNIVERSITY ■非均匀存储访问模型(NUMA),模型二 GSM GSM GSM 模型二,名词解释→ 全局互连网络 GSM Global Shared Memory CSM Cluster Shared Memory CIN Cluster Interconnection P CSM P CSM Network P=Processor C CSM P e CSM I N N CSM P CSM 群1 群V 层次式机群模型 10
并行计算机访存模型 非均匀存储访问模型 (NUMA),模型二 全局互连网络 层次式机群模型 GSM GSM ... GSM P C I N CSM P P CSM CSM 群1 P CSM 群N P P CSM CSM ... ... ... ... C I N 模型二,名词解释 GSM = Global Shared Memory CSM = Cluster Shared Memory CIN = Cluster Interconnection Network P = Processor 10

并行计算机访存模型 历粤毛子种技大” XIDIAN UNIVERSITY COMA(Cache-Only Memory Access) ■全高速缓存存储访问 >各处理器节点中没有复杂的存储层次结构,全部高速缓存组成了全局地址 空间 >利用分布的高速缓存目录D进行远程高速缓存的访问 > 使用COMA时,数据开始时可任意分配,因为在运行时它最终会被迁移 到需要使用它们的地方 名词解释→ 互连网络 D=Directory C=Cache D D D P Processor P
并行计算机访存模型 COMA(Cache-Only Memory Access) 全高速缓存存储访问 互连网络 D C P D C P D C P 名词解释 D = Directory C = Cache P = Processor ➢ 各处理器节点中没有复杂的存储层次结构,全部高速缓存组成了全局地址 空间 11 ➢ 利用分布的高速缓存目录D进行远程高速缓存的访问 ➢ 使用COMA时,数据开始时可任意分配,因为在运行时它最终会被迁移 到需要使用它们的地方

并行计算机访存模型 历些毛子种技大学 XIDIAN UNIVERSITY CC-NUMA (Coherent-Cache Nonuniform Memory Access) ■高速缓存一致性非均匀存储访问模型 >大多数使用基于目录的高速缓存一致性协议 >保留SMP结构易于编程的优点,也改善常规SMP的可扩放性 节点1 节点N SMP Symmetric Multi-processor P/C P/C Mem P/C P/C Mem DSM Distributed 总线或交叉开关 总线或交叉开关 Shared-Memory RC Remote Cache I/O NIC DIR,RC l/0 NIC,DIR,RC NIC Network Interface Circuitry 系统互连网路 DIR=高速缓存目录 12
并行计算机访存模型 CC-NUMA(Coherent-Cache Nonuniform Memory Access) 高速缓存一致性非均匀存储访问模型 I/O NIC,DIR,RC 系统互连网路 P/C P/C Mem I/O NIC,DIR,RC P/C P/C Mem 节点 1 节点 N 总线或交叉开关 总线或交叉开关 SMP = Symmetric Multi-processor DSM = Distributed Shared-Memory RC = Remote Cache NIC = Network Interface Circuitry DIR = 高速缓存目录 ➢ 大多数使用基于目录的高速缓存一致性协议 ➢ 保留SMP结构易于编程的优点,也改善常规SMP的可扩放性 12
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机系统结构模型(第一部分,含第一次作业).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)课程概述 Parallel Computing(主讲:徐悦甡).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)推荐系统(Recommender System).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)文本分类(Text Classification).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)课程回顾与复习(主讲:徐悦甡).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)语义网(Semantic Web).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)文本聚类(Text Clustering).pdf
- 西安电子科技大学:《构件与中间件技术》课程教学资源(课件讲稿)第二部分 Java EE与EJB 2.2 Java Web工程.pdf
- 西安电子科技大学:《构件与中间件技术》课程教学资源(课件讲稿)第一部分 软件构件与中间件(主讲:徐悦甡).pdf
- 西安电子科技大学:计算机软件开发模式和工具与标准发展历程(主讲:徐悦甡).pdf
- 上海海洋大学:信息学院各专业课程教学大纲(汇编).pdf
- 南京农业大学:《数据库系统原理》课程教学大纲.pdf
- 南京农业大学:《数据结构实验》课程教学大纲.pdf
- 南京农业大学:《数据库系统原理实验》课程教学大纲.pdf
- 南京农业大学:《面向对象程序设计实验》课程教学大纲.pdf
- 南京农业大学:《软件工程》课程教学大纲.pdf
- 南京农业大学:《Web 应用系统开发》课程教学大纲.pdf
- 《人工智能》课程教学资源(参考资料)基于Jupyter Notebook的Tensorflow深度学习教程.pdf
- 中国人民大学:《人工智能》课程教学资源(作业摘选)SCIgen生成文献的检测方案.pdf
- 中国人民大学:《人工智能》课程教学资源(作业摘选)人工智能课程总结.pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机性能测评.pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行程序设计基础与样例(第一部分).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行程序设计基础与样例(第二部分,交互问题与计算圆周率).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Java并发程序设计(并行程序设计基础与样例).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Java并发与并行程序设计.pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Python并发与并行程序设计(语言基础部分).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Python并发编程部分(Python并发程序设计).pdf
- 西安电子科技大学:《数据通信与计算机网络》课程教学资源(PPT课件)HDLC帧结构——高级数据链路控制协议(帧结构).pptx
- 西安电子科技大学:《数据通信与计算机网络》课程教学资源(PPT课件)数字数据通信技术——异步与同步传输.pptx
- 西安电子科技大学:《信息检索》课程教学资源(讲义)文本挖掘中的概率图模型、矩阵方法与变量求解.pdf
- 《机器学习》课程教学资源(讲稿)Academic Paper Writing for Starters.pdf
- 《机器学习》课程教学资源(讲稿)The Structure of an Academic Paper in CS(for Starters).pdf
- 《机器学习》课程教学资源(讲稿)推荐系统入门——任务、特征与方法概述(Recommender System).pdf
- 《机器学习》课程教学资源(讲稿)自然语言理解、主题建模与基于NN的语言生成 Natural Language Processing, Topic Modeling and Neural Text Generation.pdf
- 《机器学习》课程教学资源(讲稿)基于上下文的服务推荐 Context-Aware Service Recommendation.pdf
- 《机器学习》课程教学资源(讲稿)对(文本)聚类中一些问题的讨论(Thinking in Clustering).pdf
- 《机器学习》课程教学资源(讲稿)主题模型与层次主题模型(Topic Model and Hierarchical Topic Model).pdf
- 长沙理工大学:《大学计算机基础》课程教学资源(课件讲稿)第1章 计算机系统基础.pdf
- 长沙理工大学:《大学计算机基础》课程教学资源(课件讲稿)第3章 文字处理软件Word 2010.pdf
- 长沙理工大学:《大学计算机基础》课程教学资源(课件讲稿)第2章 操作系统基础.pdf