图书介绍

大数据实践PDF|Epub|txt|kindle电子书版本网盘下载

大数据实践
  • 刘鹏,张燕总主编;袁晓东主编;黄必栋副主编 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302494256
  • 出版时间:2018
  • 标注页数:222页
  • 文件大小:80MB
  • 文件页数:237页
  • 主题词:数据处理-技术培训-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 大数据概述1

1.1 从数据库到大数据库1

1.1.1 关系型数据库1

1.1.2 大数据库2

1.2 大数据库的类型4

1.3 大数据库的应用5

习题18

参考文献8

第2章 Hadoop基础9

2.1 Hadoop简介9

2.2 Hadoop部署14

2.2.1 单节点部署14

2.2.2 伪分布式部署18

2.2.3 集群部署25

2.3 Hadoop常用命令33

2.3.1 用户命令33

2.3.2 管理命令35

2.3.3 启动/关闭命令36

2.4 HDFS常用命令38

2.4.1 用户命令38

2.4.2 管理命令39

实验1 Hadoop实验41

习题242

参考文献42

第3章 Hadoop数据库HBase43

3.1 HBase简介43

3.1.1 体系架构43

3.1.2 数据模型46

3.1.3 主要特性51

3.2 HBase部署51

3.2.1 准备工作51

3.2.2 单节点部署53

3.2.3 伪分布式部署55

3.2.4 集群部署57

3.2.5 版本升级61

3.3 HBase配置63

3.3.1 配置文件63

3.3.2 主要配置项65

3.3.3 配置建议69

3.3.4 客户端配置72

3.4 HBase Shell72

3.4.1 交互模式73

3.4.2 非交互模式82

3.5 HBase模式设计84

3.5.1 设计准则84

3.5.2 列族属性88

3.5.3 表属性91

3.5.4 设计实例94

3.6 HBase安全97

3.6.1 安全访问配置97

3.6.2 数据访问权限控制99

实验2 HBase集群搭建100

习题3101

参考文献102

第4章 数据仓库工具Hive103

4.1 Hive简介103

4.1.1 工作原理104

4.1.2 体系架构104

4.1.3 数据模型106

4.2 Hive部署108

4.2.1 Hive部署模式109

4.2.2 Hive内嵌模式部署110

4.2.3 Hive本地和远程模式部署113

4.3 Hive配置115

4.4 Hive接口117

4.4.1 Hive Shell接口117

4.4.2 Hive Web接口119

4.5 Hive SQL122

4.5.1 数据类型122

4.5.2 DDL语句122

4.5.3 DML语句137

4.6 Hive操作实例146

实验3 Hive实验147

习题4150

参考文献150

第5章 内存大数据计算框架Spark151

5.1 Spark简介151

5.1.1 Spark概览151

5.1.2 Spark生态系统BDAS152

5.1.3 Spark架构与原理153

5.2 Spark部署155

5.2.1 准备工作155

5.2.2 Spark单节点部署156

5.2.3 Spark集群部署157

5.3 Spark配置169

5.3.1 Spark属性169

5.3.2 环境变量配置171

5.3.3 日志配置171

5.3.4 查看配置172

5.4 Spark RDD173

5.4.1 RDD特征174

5.4.2 RDD转换操作174

5.4.3 RDD依赖175

5.4.4 RDD行动操作177

5.5 Spark Shell177

5.5.1 准备工作177

5.5.2 启动Spark Shell178

5.5.3 创建RDD179

5.5.4 转换RDD180

5.5.5 执行RDD作业181

实验4 Spark Standalone集群搭建184

习题5185

参考文献185

第6章 Spark SQL186

6.1 Spark SQL简介186

6.1.1 Spark SQL概览186

6.1.2 Spark SQL特性188

6.1.3 Spark SQL架构与原理188

6.1.4 和Hive的兼容性190

6.1.5 数据类型191

6.2 分布式SQL引擎192

6.2.1 Spark SQL配置192

6.2.2 Spark SQL CLI195

6.2.3 Thrift JDBC/ODBC Server的搭建与测试198

6.3 使用DataFrame API处理结构化数据201

实验5 Thrift JDBC/ODBC Server的搭建与测试205

习题6206

参考文献206

附录A 大数据和人工智能实验环境208

附录B Hadoop环境要求218

附录C 名词解释220

热门推荐