《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 11 Multi-core and Multi-threading

高级计算机体系结构设计及其在数据中心和云计算的应用Lecture 11Multi-{Socket,Core,Thread]
高级计算机体系结构设计及其在数据中心和云计算的应用 Lecture 11 Multi-{Socket,Core,Thread}

高级计算机体系结构设计及其在数据中心和云计算的应用GettingMore Performance· Keep pushing IPC and/or frequenecy- Design complexity (time to market)- Cooling (cost)- Power delivery (cost)Possible,but too costly
高级计算机体系结构设计及其在数据中心和云计算的应用 Getting More Performance • Keep pushing IPC and/or frequenecy – Design complexity (time to market) – Cooling (cost) – Power delivery (cost) – . • Possible, but too costly

高级计算机体系结构设计及其在数据中心和云计算的应用Bridging the GapWatts/IPCPower has been growingexponentiallyaswell100101Diminishingreturns w.r.t.largerinstructionwindow,higherissue-widthSingle-IssueLimitsSuperscalarSuperscalarPipelinedOut-of-OrderOut-of-Order(Today)(Hypothetical-Aggressive)
高级计算机体系结构设计及其在数据中心和云计算的应用 Bridging the Gap IPC 100 10 Power has been growing exponentially as well Watts / 1 Single-Issue Pipelined Superscalar Out-of-Order (Today) Superscalar Out-of-Order (HypotheticalAggressive) Limits Diminishing returns w.r.t. larger instruction window, higher issue-width

高级计算机体系结构设计及其在数据中心和云计算的应用Higher Complexity not Worth EffortPerformanceMadesensetogoSuperscalar/OO:goodROlVerylittlegain forsubstantialeffort"Effort"ScalarModerate-PipeVery-Deep-PipeIn-OrderSuperscalar/000AggressiveSuperscalar/000
高级计算机体系结构设计及其在数据中心和云计算的应用 Higher Complexity not Worth Effort Performance Made sense to go Superscalar/OOO: good ROI Very little gain for substantial effort “Effort” Scalar In-Order Moderate-Pipe Superscalar/OOO Very-Deep-Pipe Aggressive Superscalar/OOO

高级计算机体系结构设计及其在数据中心和云计算的应用User Visible/Invisible. All performance gains up to this point were“free"- No user intervention required (beyond buying new chip)·Recompilation/rewritingcouldprovideevenmorebenefit-Higherfrequency&higherIPC- Same IsA, different micro-architecture:Multi-processing pushes parallelism above ISA-Coarsegrainedparallelism.Providemultipleprocessingelements- User (or developer) responsible for finding parallelism·User decides howto use resources
高级计算机体系结构设计及其在数据中心和云计算的应用 User Visible/Invisible • All performance gains up to this point were “free” – No user intervention required (beyond buying new chip) • Recompilation/rewriting could provide even more benefit – Higher frequency & higher IPC – Same ISA, different micro-architecture • Multi-processing pushes parallelism above ISA – Coarse grained parallelism • Provide multiple processing elements – User (or developer) responsible for finding parallelism • User decides how to use resources

高级计算机体系结构设计及其在数据中心和云计算的应用Sources of (Coarse) Parallelism.Differentapplications-MP3playerinbackground whileyouwork inOffice- Other background tasks: Os/kernel, virus check, etc...- Piped applicationsgunzip-cfoo.gzIgrepbarIperlsome-script.plThreads within the same applicationJava(scheduling,GC,etc...)- Explicitly coded multi-threading.pthreads,MPl,etc
高级计算机体系结构设计及其在数据中心和云计算的应用 Sources of (Coarse) Parallelism • Different applications – MP3 player in background while you work in Office – Other background tasks: OS/kernel, virus check, etc. – Piped applications • gunzip -c foo.gz | grep bar | perl some c foo.gz | grep bar | perl some-script.pl script.pl • Threads within the same application – Java (scheduling, GC, etc.) – Explicitly coded multi-threading • pthreads, MPI, etc

高级计算机体系结构设计及其在数据中心和云计算的应用SMp MachinesSMP= SymmetricMulti-Processing- Symmetric = All cPUs have“equal" access to memoryOS seems multiple CPUs-Runsoneprocess(orthread)oneachCPUCPU。CPU,CPU2CPU3
高级计算机体系结构设计及其在数据中心和云计算的应用 SMP Machines • SMP = Symmetric Multi-Processing – Symmetric = All CPUs have “equal” access to memory • OS seems multiple CPUs – Runs one process (or thread) on each CPU CPU0 CPU1 CPU2 CPU3

高级计算机体系结构设计及其在数据中心和云计算的应用MpWorkloadBenefitsruntimeTaskATask B3-wide000CPUTaskATask B4-wide000CPUBenefit3-wide3-wideTaskATask B00000CPUCPUTaskA2-wide2-wideTask B000000CPUCPUAssumesyouhavemultipletasks/programsto run
高级计算机体系结构设计及其在数据中心和云计算的应用 MP Workload Benefits 3-wide OOO CPU Task A Task B 4-wide OOO Task A Task B runtime CPU Benefit 3-wide OOO CPU Task A Task B 3-wide OOO CPU 2-wide OOO CPU Task B 2-wide Task A OOO CPU Assumes you have multiple tasks/programs to run

高级计算机体系结构设计及其在数据中心和云计算的应用... If Only One Task AvailableruntimeTaskA3-wide000CPUTaskA4-wideBenefit000CPU3-wideTaskAWIdENobenefitoverICPU00080CPUCPUTaskA2-widePerformance0000CPUSDdegradation!Idle
高级计算机体系结构设计及其在数据中心和云计算的应用 . If Only One Task Available 3-wide OOO CPU Task A 4-wide OOO Task A Benefit runtime CPU 3-wide OOO CPU 3-wide OOO CPU Task A 2-wide OOO CPU 2-wide OOO CPU Task A Idle No benefit over 1 CPU Performance degradation!

高级计算机体系结构设计及其在数据中心和云计算的应用Benefit of Mp Depends on WorkloadLimited number of parallel tasks to run on PC-Adding moreCPUs thantasksprovidezero benefitForparallel code,Amdahl'slaw curbs speedupparallelizableICPU2CPUs3CPUs4CPUs
高级计算机体系结构设计及其在数据中心和云计算的应用 Benefit of MP Depends on Workload • Limited number of parallel tasks to run on PC – Adding more CPUs than tasks provide zero benefit • For parallel code, Amdahl’s law curbs speedup parallelizable 1CPU 2CPUs 3CPUs 4CPUs
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 14 Towards Renewable Energy Powered Sustainable and Green Cloud Datacenters.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 15 GPGPU Architecture and Programming Paradigm.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 12 Shared Memory Multiprocessor.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 1 Instruction Set Architecture(Introduction).pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 0 Introduction and Performance Evaluation.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 3 Pipelining.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 2 Instruction Set Architecture(Microarchitecture Implementation).pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 7 Multiprocessors.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 4 Spectualtive Execution.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 6 Memory Hierarchy and Cache.pdf
- 《现代计算机体系结构》课程教学课件(留学生版)Lecture 5 Out of Order Execution.pdf
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第4章 基于统计决策的概率分类法.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第1章 绪论、第2章 聚类分析.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第3章 判别函数及几何分类法.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第7章 模糊模式识别法.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第6章 句法模式识别.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第5章 特征选择与特征提取.ppt
- 武汉理工大学:《模式识别》课程教学资源(PPT课件)第8章 神经网络模式识别法.ppt
- 武汉理工大学:《模式识别》课程教学资源(实验指导,共五个实验).pdf
- 武汉理工大学:《模式识别》课程授课教案(讲义)第8章 神经网络在模式识别中的应用.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 10 Out of Order and Speculative Execution.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 13 An Introduction to Cloud Data Centers.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 09 Case Study- Jave Branch Prediction Optimization.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 07 Instruction Decode.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 08 Instruction Fetch and Branch Predictioin.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 06 Scoreboarding and Tomasulo.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 04 Memory Data Prefetching.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 05 Core Pipelining.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 02 Memory Hierarchy and Caches.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 03 Main Memory and DRAM.pdf
- 《现代计算机体系结构》课程教学课件(英文讲稿)Lecture 01 Introduction and Performance Evaluation-new.pdf
- 东北大学:某学院计算机科学与技术专业《智能信息系统开发》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《软件工程综合实践》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《创新创业设计基础》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《工程领导力》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《高等数学建模》课程教学大纲(二).pdf
- 东北大学:某学院计算机科学与技术专业《数据库原理》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《物理建模》课程教学大纲 A.pdf
- 东北大学:某学院计算机科学与技术专业《Java程序设计基础》课程教学大纲.pdf
- 东北大学:某学院计算机科学与技术专业《算法设计与分析》课程教学大纲.pdf