图书介绍
Hadoop 2.0-YARN核心技术实践PDF|Epub|txt|kindle电子书版本网盘下载
- 周维编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302411390
- 出版时间:2015
- 标注页数:204页
- 文件大小:100MB
- 文件页数:213页
- 主题词:数据处理软件
PDF下载
下载说明
Hadoop 2.0-YARN核心技术实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 YARN的前世今生1
1.1 Hadoop基本情况回顾1
1.2 为什么我们需要YARN2
1.3 YARN和Hadoop 1.0对比分析3
1.3.1 体系结构对比3
1.3.2 运算框架对比5
1.4 Hadoop生态系统6
1.5 小结6
第2章 YARN基本框架8
2.1 YARN基本框架8
2.2 ResourceManager9
2.3 NodeManager10
2.4 ApplicationMaster11
2.5 YARN中应用程序的运行过程12
第3章 YARN编程初步13
3.1 YARN安装与配置13
3.1.1 环境准备13
3.1.2 伪分布式安装14
3.1.3 完全分布式安装18
3.2 源码阅读及编译22
3.2.1 Maven的介绍及安装22
3.2.2 编译前准备23
3.2.3 YARN源码阅读环境配置24
3.2.4 YARN源码编译27
3.3 MapReduce实例28
3.3.1 Word Count28
3.3.2 Deduplication32
3.3.3 Sort36
3.4 HBase编程初步38
3.4.1 HBase介绍38
3.4.2 HBase安装与配置39
3.4.3 HBase开发环境配置及实例43
第4章 YARN核心组件分析47
4.1 通信组件Protocol Buffer47
4.1.1 什么是Protocol Buffer47
4.1.2 YARN中的Protocol Buffer47
4.1.3 如何编写Protocol Buffer47
4.1.4 Protocol Buffer代码分析49
4.2 Hadoop 1.0 RPC和YARN RPC50
4.2.1 什么是RPC50
4.2.2 RPC通信模型50
4.2.3 Hadoop 1.0 RPC的实现过程51
4.2.4 Hadoop 1.0 RPC的应用51
4.2.5 YARN RPC52
4.2.6 YARN RPC通信案例解析53
4.2.7 YARN RPC源代码导读59
4.3 YARN状态机分析61
4.3.1 RMApp状态机61
4.3.2 RMAppAttempt状态机65
4.3.3 RMNode状态机69
4.3.4 RMContainer状态机71
4.3.5 应用程序在RM中的完整运行流程分析72
4.3.6 状态机源代码导读75
4.3.7 YARN状态机监控软件设计76
4.4 HDFS Federation84
4.4.1 HDFS的层次84
4.4.2 当前的HDFS架构84
4.4.3 HDFS Federation85
4.4.4 Federation HDFS与当前HDFS的比较86
第5章 YARN中几种计算模型87
5.1 基于YARN的MapReduce进阶87
5.1.1 Reduce Side Join87
5.1.2 Map Side Join91
5.1.3 并行聚类Kmeans算法设计与实现92
5.2 Storm on YARN96
5.2.1 Storm基本原理96
5.2.2 Storm on YARN98
5.2.3 Storm单机模式安装98
5.2.4 Storm on YARN安装102
5.2.5 基于Storm onYARN的实时出租车管理系统106
5.3 Spark on YARN112
5.3.1 Spark简介112
5.3.2 Spark基本原理114
5.3.3 Spark的部署及开发环境搭建118
5.3.4 Spark MLlib介绍126
5.3.5 Spark的优化配置127
5.3.6 Spark的编程案例129
5.3.7 Spark的应用案例132
第6章 YARN资源调度器136
6.1 Hadoop资源调度器回顾136
6.2 YARN资源调度器138
6.2.1 Capacity Scheduler138
6.2.2 Fair Scheduler141
6.2.3 调度器比较146
6.3 YARN调度负载模拟器-SLS146
6.3.1 综述146
6.3.2 参数和命令148
6.3.3 实例一 快速开始150
6.3.4 实例二 定制运行151
6.4 Google第三代调度器分析158
6.4.1 中央式调度器模式158
6.4.2 双层调度器模式160
6.4.3 共享状态调度器164
6.4.4 Google第三代调度器Omega166
6.4.5 Omega集群调度模拟器-CSS169
第7章 YARN工作流分析173
7.1 Tez on YARN173
7.1.1 Tez基本原理173
7.1.2 Tez环境安装177
7.1.3 Tez在Hive引擎中的优化作用191
7.1.4 小结195
7.2 显式工作流引擎196
7.2.1 Hadoop工作流引擎196
7.2.2 某大型互联网公司部门使用的工作流引擎197
7.2.3 应用举例200
7.2.4 对比202
7.2.5 小结203
参考文献204