图书介绍

并行多核体系结构基础PDF|Epub|txt|kindle电子书版本网盘下载

并行多核体系结构基础
  • (美)汤孟岩(YanSolihin)著;钱德沛(等)译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111610410
  • 出版时间:2018
  • 标注页数:372页
  • 文件大小:149MB
  • 文件页数:386页
  • 主题词:并行程序-程序设计;微处理器-计算机体系结构

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

并行多核体系结构基础PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 多核体系结构概述1

1.1多核体系结构的由来2

1.2并行计算机概述9

1.2.1并行计算机的Flynn分类法12

1.2.2MIMD并行计算机分类13

1.3未来的多核体系结构14

1.4习题18

课堂习题18

课后习题18

第2章 并行编程概述20

2.1并行程序性能的限制因素20

2.2并行编程模型23

2.2.1共享存储与消息传递模型的对比25

2.2.2一个简单的例子26

2.2.3其他编程模型29

2.3习题37

课后习题37

第3章 共享存储并行编程39

3.1并行编程的步骤39

3.2依赖分析40

3.2.1循环级依赖分析42

3.2.2迭代空间遍历图和循环传递依赖图42

3.3识别循环结构中的并行任务45

3.3.1循环迭代间的并行和DOALL并行45

3.3.2DOACROSS:循环迭代间的同步并行46

3.3.3循环中语句间的并行48

3.3.4DOPIPE:循环中语句间的流水线并行50

3.4识别其他层面的并行51

3.5通过算法知识识别并行53

3.6确定变量的范围55

3.6.1私有化56

3.6.2归约变量和操作57

3.6.3准则58

3.7同步59

3.8任务到线程的映射60

3.9线程到处理器的映射64

3.10OpenMP概述67

3.11习题72

课堂习题72

课后习题77

第4章 针对链式数据结构的并行编程79

4.1LDS并行化所面临的挑战79

4.2LDS并行化技术80

4.2.1计算并行化与遍历80

4.2.2针对数据结构的操作并行化82

4.3针对链表的并行化技术89

4.3.1读操作之间的并行89

4.3.2LDS遍历中的并行91

4.3.3细粒度锁方法94

4.4事务内存98

4.5习题99

课堂习题99

课后习题101

第5章 存储层次结构概述103

5.1存储层次的意义103

5.2高速缓存体系结构基础104

5.2.1数据放置策略105

5.2.2数据替换策略109

5.2.3数据写策略111

5.2.4多级高速缓存中的包含策略113

5.2.5统一/分立/Banked高速缓存和高速缓存流水线117

5.2.6高速缓存寻址和旁路转换缓冲119

5.2.7非阻塞式高速缓存121

5.3高速缓存性能122

5.3.1高速缓存缺失的幂次定律124

5.3.2栈距离特性125

5.3.3高速缓存性能指标126

5.4预取127

5.4.1步长预取和顺序预取128

5.4.2多处理器系统中的预取130

5.5多核体系结构中的高速缓存设计130

5.6高速缓存的物理组成131

5.6.1集中式高速缓存131

5.6.2分布式高速缓存133

5.6.3混合式高速缓存133

5.7高速缓存的逻辑组成135

5.7.1散列函数139

5.7.2改善共享高速缓存的距离局部性140

5.7.3私有高速缓存结构中的容量共享141

5.8案例分析143

5.8.1IBM Power7的存储层次143

5.8.2AMD Shanghai和Intel Barcelona处理器存储层次的比较146

5.9习题148

课堂习题148

课后习题150

第6章 共享存储多处理器简介152

6.1缓存一致性问题153

6.2存储一致性问题155

6.3同步问题156

6.4习题160

课堂习题160

课后习题161

第7章 缓存一致性基础163

7.1概述164

7.2基于总线的多处理器缓存一致性问题168

7.2.1“写直达”缓存的一致性协议168

7.2.2“写回”缓存的MSI协议170

7.2.3“写回”缓存的MESI协议175

7.2.4“写回”缓存的MOESI协议178

7.2.5“写回”缓存基于更新的协议183

7.3缓存设计对缓存一致性性能的影响186

7.4性能及其他实际问题187

7.4.1预取和一致性缺失187

7.4.2多级缓存187

7.4.3侦听过滤189

7.5点对点互连网络上的广播式协议189

7.6习题203

课堂习题203

课后习题207

第8章 对同步的硬件支持209

8.1锁的实现209

8.1.1对锁实现性能的评估209

8.1.2对原子指令的需求210

8.1.3TS锁212

8.1.4TTSL214

8.1.5LL/SC锁215

8.1.6Ticket锁218

8.1.7ABQL219

8.1.8各种锁实现的量化比较221

8.2栅障的实现222

8.2.1翻转感应集中式栅障223

8.2.2组合树栅障225

8.2.3硬件栅障实现225

8.3事务内存227

8.4练习232

课堂习题232

课后习题236

第9章 存储一致性模型238

9.1程序员的直觉238

9.2保证顺序一致性的体系结构机制242

9.2.1在基于总线的多处理器中基本的SC实现242

9.2.2改善SC性能的技术244

9.3松弛的一致性模型246

9.3.1安全网246

9.3.2处理器一致性246

9.3.3弱序248

9.3.4释放一致性250

9.3.5惰性释放一致性253

9.4不同存储一致性模型中的同步254

9.5习题256

课堂习题256

课后习题260

第10章 高级缓存一致性设计262

10.1目录式一致性协议262

10.2目录式一致性协议概览262

10.3目录式缓存一致性协议基础268

10.4实现正确性和性能272

10.4.1由目录状态不同步引起的竞争处理272

10.4.2由对请求非实时处理引起的竞争处理274

10.4.3写传播和事务串行化280

10.4.4同步支持281

10.4.5存储一致性模型282

10.5当前设计问题283

10.5.1处理不精确的目录信息283

10.5.2一致性粒度286

10.5.3系统划分288

10.5.4加速线程迁移289

10.6习题291

课堂习题291

课后习题293

第11章 互连网络体系结构295

11.1链路、信道和延迟296

11.2网络拓扑298

11.3路由策略和算法302

11.4路由器体系结构312

11.5案例研究:Alpha 21364网络体系结构315

11.6多核设计的问题317

11.7习题319

课堂习题319

课后习题321

第12章 SIMT体系结构323

12.1SIMT编程模型323

12.2将SIMT工作负载映射到SIMT核上325

12.3SIMT核体系结构326

12.3.1标量ISA326

12.3.2SIMD化/向量化:Warp构造326

12.3.3细粒度多线程(Warp级并行)328

12.3.4微体系结构328

12.3.5流水线执行329

12.3.6控制流处理330

12.3.7内存系统331

12.4习题334

课堂习题334

课后习题335

第13章 专家访谈337

参考文献356

索引361

热门推荐