图书介绍
Apache Kylin权威指南PDF|Epub|txt|kindle电子书版本网盘下载
![Apache Kylin权威指南](https://www.shukui.net/cover/27/31949400.jpg)
- ApacheKylin核心团队著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111557012
- 出版时间:2017
- 标注页数:190页
- 文件大小:30MB
- 文件页数:207页
- 主题词:互联网络-网络服务器
PDF下载
下载说明
Apache Kylin权威指南PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 Apache Kylin概述1
1.1 背景和历史1
1.2 Apache Kylin的使命3
1.2.1 为什么要使用Apache Kylin3
1.2.2 Apache Kylin怎样解决关键问题4
1.3 Apache Kylin的工作原理5
1.3.1 维度和度量简介5
1.3.2 Cube和Cuboid5
1.3.3 工作原理6
1.4 Apache Kylin的技术架构7
1.5 Apache Kylin的主要特点9
1.5.1 标准SQL接口9
1.5.2 支持超大数据集9
1.5.3 亚秒级响应10
1.5.4 可伸缩性和高吞吐率10
1.5.5 BI及可视化工具集成11
1.6 与其他开源产品比较11
1.7 小结12
第2章 快速入门13
2.1 核心概念13
2.1.1 数据仓库、OLAP与BI13
2.1.2 维度和度量14
2.1.3 事实表和维度表14
2.1.4 Cube、Cuboid和Cube Segment15
2.2 在Hive中准备数据15
2.2.1 星形模型15
2.2.2 维度表的设计16
2.2.3 Hive表分区16
2.2.4 了解维度的基数17
2.2.5 Sample Data17
2.3 设计Cube17
2.3.1 导入Hive表定义18
2.3.2 创建数据模型18
2.3.3 创建Cube21
2.4 构建Cube25
2.4.1 全量构建和增量构建27
2.4.2 历史数据刷新28
2.4.3 合并29
2.5 查询Cube30
2.6 SQL参考31
2.7 小结32
第3章 增量构建33
3.1 为什么要增量构建33
3.2 设计增量Cube35
3.2.1 设计增量Cube的前提35
3.2.2 增量Cube的创建36
3.3 触发增量构建37
3.3.1 WebGUI触发37
3.3.2 构建相关的RestAPI39
3.4 管理Cube碎片45
3.4.1 合并Segment46
3.4.2 自动合并47
3.4.3 保留Segment48
3.4.4 数据持续更新49
3.5 小结50
第4章 流式构建51
4.1 为什么要流式构建51
4.2 准备流式数据52
4.2.1 数据格式52
4.2.2 消息队列53
4.2.3 创建Schema53
4.3 设计流式Cube56
4.3.1 创建Model56
4.3.2 创建Cube57
4.4 流式构建原理59
4.5 触发流式构建61
4.5.1 单次触发61
4.5.2 自动化多次触发61
4.5.3 出错处理62
4.6 小结63
第5章 查询和可视化64
5.1 Web GUI64
5.1.1 查询64
5.1.2 显示结果65
5.2 RestAPI67
5.2.1 查询认证67
5.2.2 查询请求参数67
5.2.3 查询返回结果68
5.3 ODBC69
5.4 JDBC71
5.4.1 获得驱动包71
5.4.2 认证71
5.4.3 URL格式71
5.4.4 获取元数据信息72
5.5 通过Tableau访问Kylin72
5.5.1 连接Kylin数据源73
5.5.2 设计数据模型73
5.5.3 通过Live方式连接73
5.5.4 自定义SQL75
5.5.5 可视化75
5.5.6 发布到Tableau Server76
5.6 Zeppelin集成77
5.6.1 Zeppelin架构简介77
5.6.2 KylinInterpreter的工作原理77
5.6.3 如何使用Zeppelin访问Kylin78
5.7 小结80
第6章 Cube优化81
6.1 Cuboid剪枝优化81
6.1.1 维度的诅咒81
6.1.2 检查Cuboid数量82
6.1.3 检查Cube大小83
6.1.4 空间与时间的平衡84
6.2 剪枝优化的工具85
6.2.1 使用衍生维度85
6.2.2 使用聚合组87
6.3 并发粒度优化89
6.4 Rowkeys优化90
6.4.1 编码90
6.4.2 按维度分片91
6.4.3 调整Rowkeys顺序92
6.5 其他优化93
6.5.1 降低度量精度93
6.5.2 及时清理无用的Segment94
6.6 小结94
第7章 应用案例分析95
7.1 基本多维分析95
7.1.1 数据集95
7.1.2 数据导入97
7.1.3 创建数据模型99
7.1.4 创建Cube102
7.1.5 构建Cube108
7.1.6 SQL查询110
7.2 流式分析112
7.2.1 Kafka数据源112
7.2.2 创建数据表113
7.2.3 创建数据模型115
7.2.4 创建Cube117
7.2.5 构建Cube118
7.2.6 SQL查询119
7.3 小结119
第8章 扩展ApacheKylin120
8.1 可扩展式架构120
8.1.1 工作原理121
8.1.2 三大主要接口122
8.2 计算引擎扩展124
8.2.1 EngineFactory124
8.2.2 MRBatchCubingEngine2125
8.2.3 BatchCubingJobBuilder2126
8.2.4 IMRInput128
8.2.5 IMROutput2129
8.3 数据源扩展130
8.4 存储扩展132
8.5 聚合类型扩展134
8.5.1 聚合的JSON定义134
8.5.2 聚合类型工厂135
8.5.3 聚合类型的实现136
8.6 维度编码扩展140
8.6.1 维度编码的JSON定义140
8.6.2 维度编码工厂141
8.6.3 维度编码的实现142
8.7 小结143
第9章 ApacheKylin的企业级功能144
9.1 身份验证144
9.1.1 自定义验证145
9.1.2 LDAP验证146
9.1.3 单点登录150
9.2 授权151
9.3 小结153
第10章 运维管理154
10.1 安装和配置154
10.1.1 必备条件154
10.1.2 快速启动Apache Kylin157
10.1.3 配置Apache Kylin160
10.1.4 企业部署162
10.2 监控和诊断165
10.2.1 日志165
10.2.2 任务报警167
10.2.3 诊断工具169
10.3 日常维护170
10.3.1 基本运维170
10.3.2 元数据备份170
10.3.3 元数据恢复171
10.3.4 系统升级172
10.3.5 垃圾清理174
10.4 常见问题和修复175
10.5 获得社区帮助176
10.5.1 邮件列表177
10.5.2 JIRA177
10.6 小结177
第11章 参与开源178
11.1 Apache Kylin的开源历程178
11.2 为什么参与开源179
11.3 Apache开源社区简介179
11.3.1 简介179
11.3.2 组织构成与运作模式180
11.3.3 项目角色181
11.3.4 孵化项目及顶级项目182
11.4 如何贡献到开源社区183
11.4.1 什么是贡献183
11.4.2 如何贡献183
11.5 礼仪与文化184
11.6 如何参与ApacheKylin185
11.7 小结185
第12章 Apache Kylin的未来186
12.1 大规模流式构建186
12.2 拥抱Spark技术栈187
12.3 更快的存储和查询187
12.4 前端展现及与BI工具的整合187
12.5 高级OLAP函数188
12.6 展望188