图书介绍

Hadoop 2.0-YARN核心技术实践PDF|Epub|txt|kindle电子书版本网盘下载

Hadoop 2.0-YARN核心技术实践
  • 周维编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302411390
  • 出版时间:2015
  • 标注页数:204页
  • 文件大小:100MB
  • 文件页数:213页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Hadoop 2.0-YARN核心技术实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 YARN的前世今生1

1.1 Hadoop基本情况回顾1

1.2 为什么我们需要YARN2

1.3 YARN和Hadoop 1.0对比分析3

1.3.1 体系结构对比3

1.3.2 运算框架对比5

1.4 Hadoop生态系统6

1.5 小结6

第2章 YARN基本框架8

2.1 YARN基本框架8

2.2 ResourceManager9

2.3 NodeManager10

2.4 ApplicationMaster11

2.5 YARN中应用程序的运行过程12

第3章 YARN编程初步13

3.1 YARN安装与配置13

3.1.1 环境准备13

3.1.2 伪分布式安装14

3.1.3 完全分布式安装18

3.2 源码阅读及编译22

3.2.1 Maven的介绍及安装22

3.2.2 编译前准备23

3.2.3 YARN源码阅读环境配置24

3.2.4 YARN源码编译27

3.3 MapReduce实例28

3.3.1 Word Count28

3.3.2 Deduplication32

3.3.3 Sort36

3.4 HBase编程初步38

3.4.1 HBase介绍38

3.4.2 HBase安装与配置39

3.4.3 HBase开发环境配置及实例43

第4章 YARN核心组件分析47

4.1 通信组件Protocol Buffer47

4.1.1 什么是Protocol Buffer47

4.1.2 YARN中的Protocol Buffer47

4.1.3 如何编写Protocol Buffer47

4.1.4 Protocol Buffer代码分析49

4.2 Hadoop 1.0 RPC和YARN RPC50

4.2.1 什么是RPC50

4.2.2 RPC通信模型50

4.2.3 Hadoop 1.0 RPC的实现过程51

4.2.4 Hadoop 1.0 RPC的应用51

4.2.5 YARN RPC52

4.2.6 YARN RPC通信案例解析53

4.2.7 YARN RPC源代码导读59

4.3 YARN状态机分析61

4.3.1 RMApp状态机61

4.3.2 RMAppAttempt状态机65

4.3.3 RMNode状态机69

4.3.4 RMContainer状态机71

4.3.5 应用程序在RM中的完整运行流程分析72

4.3.6 状态机源代码导读75

4.3.7 YARN状态机监控软件设计76

4.4 HDFS Federation84

4.4.1 HDFS的层次84

4.4.2 当前的HDFS架构84

4.4.3 HDFS Federation85

4.4.4 Federation HDFS与当前HDFS的比较86

第5章 YARN中几种计算模型87

5.1 基于YARN的MapReduce进阶87

5.1.1 Reduce Side Join87

5.1.2 Map Side Join91

5.1.3 并行聚类Kmeans算法设计与实现92

5.2 Storm on YARN96

5.2.1 Storm基本原理96

5.2.2 Storm on YARN98

5.2.3 Storm单机模式安装98

5.2.4 Storm on YARN安装102

5.2.5 基于Storm onYARN的实时出租车管理系统106

5.3 Spark on YARN112

5.3.1 Spark简介112

5.3.2 Spark基本原理114

5.3.3 Spark的部署及开发环境搭建118

5.3.4 Spark MLlib介绍126

5.3.5 Spark的优化配置127

5.3.6 Spark的编程案例129

5.3.7 Spark的应用案例132

第6章 YARN资源调度器136

6.1 Hadoop资源调度器回顾136

6.2 YARN资源调度器138

6.2.1 Capacity Scheduler138

6.2.2 Fair Scheduler141

6.2.3 调度器比较146

6.3 YARN调度负载模拟器-SLS146

6.3.1 综述146

6.3.2 参数和命令148

6.3.3 实例一 快速开始150

6.3.4 实例二 定制运行151

6.4 Google第三代调度器分析158

6.4.1 中央式调度器模式158

6.4.2 双层调度器模式160

6.4.3 共享状态调度器164

6.4.4 Google第三代调度器Omega166

6.4.5 Omega集群调度模拟器-CSS169

第7章 YARN工作流分析173

7.1 Tez on YARN173

7.1.1 Tez基本原理173

7.1.2 Tez环境安装177

7.1.3 Tez在Hive引擎中的优化作用191

7.1.4 小结195

7.2 显式工作流引擎196

7.2.1 Hadoop工作流引擎196

7.2.2 某大型互联网公司部门使用的工作流引擎197

7.2.3 应用举例200

7.2.4 对比202

7.2.5 小结203

参考文献204

热门推荐