图书介绍

计算机科学丛书 ARM嵌入式系统编程与优化PDF|Epub|txt|kindle电子书版本网盘下载

计算机科学丛书 ARM嵌入式系统编程与优化
  • (美)詹森 D.巴克斯著;梁元宇译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111578031
  • 出版时间:2017
  • 标注页数:204页
  • 文件大小:68MB
  • 文件页数:217页
  • 主题词:微处理器-系统设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

计算机科学丛书 ARM嵌入式系统编程与优化PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 Linux/ARM嵌入式平台1

1.1 以性能为导向的编程2

1.2 ARM技术3

1.3 ARM简史4

1.4 ARM编程4

1.5 ARM体系集架构5

1.5.1 ARM通用寄存器5

1.5.2 状态寄存器6

1.5.3 内存寻址模式7

1.5.4 GNU ARM汇编8

1.6 汇编优化1:排序8

1.6.1 参考实现8

1.6.2 汇编实现9

1.6.3 结果验证11

1.6.4 分析编译器生成的代码13

1.7 汇编优化2:位操作15

1.8 代码优化目标16

1.8.1 减少执行指令数16

1.8.2 降低平均CPI16

1.9 使用性能计数器的运行时分析18

1.9.1 ARM性能监控单元18

1.9.2 Linux Perf_Event18

1.9.3 性能计数器的基础架构19

1.10 检测存储器带宽22

1.11 性能测试结果25

1.12 性能界限25

1.13 基本指令集26

1.13.1 整型算术指令26

1.13.2 按位逻辑指令26

1.13.3 移位指令27

1.13.4 移动指令27

1.13.5 加载和存储指令28

1.13.6 比较指令28

1.13.7 分支指令29

1.13.8 浮点指令29

1.14 小结30

习题31

第2章 多核和数据层优化:OpenMP和SIMD33

2.1 本书所涉及的优化技术33

2.2 阿姆达尔定律34

2.3 测试内核:多项式评估35

2.4 使用多核:OpenMP37

2.4.1 OpenMP指令37

2.4.2 范围39

2.4.3 其他OpenMP指令42

2.4.4 OpenMP同步42

2.4.5 调试OpenMP代码44

2.4.6 OpenMP并行循环编译指令46

2.4.7 OpenMP与性能计数器48

2.4.8 OpenMP支持霍纳内核48

2.5 性能界限48

2.6 性能分析49

2.7 GCC中的内联汇编语言50

2.8 优化1:降低每flop的指令数51

2.9 优化2:降低CPI54

2.9.1 软件流水线54

2.9.2 软件流水线的霍纳方法57

2.10 优化3:使用SIMD时的每指令多flop63

2.10.1 ARM11的VFP短向量指令65

2.10.2 ARM Cortex的NEON指令67

2.10.3 NEON内联函数69

2.11 小结70

习题71

第3章 算法优化和Linux帧缓冲72

3.1 Linux帧缓冲72

3.2 仿射图像变换74

3.3 双线性插值74

3.4 浮点图像变换75

3.4.1 加载图像76

3.4.2 渲染帧78

3.5 浮点性能分析82

3.6 定点运算82

3.6.1 定点与浮点:准确度83

3.6.2 定点与浮点:范围83

3.6.3 定点与浮点:精度83

3.6.4 使用定点84

3.6.5 高效定点加法84

3.6.6 高效定点乘法87

3.6.7 确定小数点的位置89

3.6.8 图像变换的范围和准确度要求90

3.6.9 将浮点值转换为定点值的运算90

3.7 定点性能92

3.8 实时分形生成92

3.8.1 像素着色94

3.8.2 放大94

3.8.3 范围和准确度要求95

3.9 小结96

习题96

第4章 存储优化和视频处理99

4.1 模板循环99

4.2 模板案例:均值滤波器100

4.3 可分离滤波器100

4.3.1 高斯模糊101

4.3.2 Sobel滤波器103

4.3.3 Harris角点检测器104

4.3.4 Lucas-Kanade光流106

4.4 二维滤波器的存储访问行为108

4.4.1 二维数据展示108

4.4.2 按行滤波108

4.4.3 按列滤波109

4.5 循环分块110

4.6 分块和模板晕区112

4.7 二维滤波实现案例112

4.8 视频帧的捕获和转换116

4.8.1 YUV和色度抽样116

4.8.2 将分块导出到帧缓冲区118

4.9 Video4Linux驱动和API119

4.10 使用二维分块滤波器122

4.11 应用可分离的二维分块滤波器123

4.12 顶层循环124

4.13 性能结果124

4.14 小结124

习题125

第5章 利用OpenCL进行嵌入式异构编程127

5.1 GPU微体系结构128

5.2 OpenCL128

5.3 OpenCL编程模型、语法及摘要129

5.3.1 主机/设备编程模型129

5.3.2 错误检查130

5.3.3 平台层:初始化平台131

5.3.4 平台层:初始化设备133

5.3.5 平台层:初始化上下文135

5.3.6 平台层:内核控制136

5.3.7 平台层:内核编译137

5.3.8 平台层:设备存储分配140

5.4 内核工作负荷分配141

5.4.1 设备存储区142

5.4.2 内核参数143

5.4.3 内核向量化145

5.4.4 霍纳内核的参数空间146

5.4.5 内核属性147

5.4.6 内核调度147

5.5 霍纳方法的OpenCL实现:设备码152

5.6 性能结果156

5.6.1 参数探索156

5.6.2 工作组数156

5.6.3 工作组大小157

5.6.4 向量大小157

5.7 小结158

习题158

附录A 为Raspberry Pi 1的Raspbian系统添加PMU支持160

附录B NEON内联函数指令163

附录C OpenCL参考175

热门推荐