图书介绍
数据仓库工具箱 面向SQL Server2005和Microsoft商业智能工具集PDF|Epub|txt|kindle电子书版本网盘下载
- (美)曼蒂,桑斯维特,金伯尔著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302163790
- 出版时间:2007
- 标注页数:566页
- 文件大小:104MB
- 文件页数:597页
- 主题词:数据库系统
PDF下载
下载说明
数据仓库工具箱 面向SQL Server2005和Microsoft商业智能工具集PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 需求、实施和体系结构第1章 定义业务需求3
1.1 长期成功的最重要的决定因素4
1.2 揭示业务价值4
1.2.1 获得赞助商关系5
1.2.2 定义企业级业务需求5
1.2.3 区分优先级过程13
1.2.4 项目规划15
1.2.5 收集项目需求15
1.3 业务需求示例:Adventure Works Cycles16
1.3.1 Adventure Works Cycles公司的采访准备17
1.3.2 Adventure Works Cycles企业业务需求19
1.3.3 分析主题和业务过程23
1.3.4 Adventure Works Cycles总线矩阵25
1.3.5 Adventure Works Cycles区分优先级过程26
1.3.6 订单项目的业务需求27
1.4 小结27
第2章 业务过程维度模型设计29
2.1 维度建模概念和术语30
2.1.1 事实表31
2.1.2 维度32
2.1.3 整合事实和维度33
2.1.4 总线矩阵、一致性维度和交叉探查34
2.2 其他设计概念和技术37
2.2.1 代理键37
2.2.2 渐变维度38
2.2.3 日期42
2.2.4 退化维度43
2.2.5 雪花模型43
2.2.6 多对多维度或者多值维度44
2.2.7 层次结构46
2.2.8 异构产品47
2.2.9 聚合维度48
2.2.10 无意义维度50
2.2.11 三种事实表类型51
2.2.12 聚合52
2.3 维度建模过程53
2.3.1 准备工作55
2.3.2 数据记录和研究59
2.3.3 构建维度模型62
2.3.4 开发详细维度模型66
2.3.5 模型测试67
2.3.6 评审和确认模型68
2.4 案例研究:创建Adventure Works Cycles订单维度模型68
2.4.1 选择维度68
2.4.2 确定订单业务过程的维度和事实属性73
2.4.3 初始模型的最终草图74
2.4.4 问题列表75
2.4.5 详细维度模型开发75
2.4.6 最终维度模型77
2.5 小结77
第3章 工具集79
3.1 Microsoft DW/BI工具集80
3.2 使用Microsoft工具集的原因81
3.3 Microsoft DW/BI系统的体系结构81
3.3.1 包含Analysis Services的原因83
3.3.2 关于Analysis Services的争论84
3.3.3 存储在关系数据库中的原因85
3.4 Microsoft工具概述85
3.4.1 需要的产品86
3.4.2 SQL Server2005开发和管理工具88
3.5 小结92
第Ⅱ部分 开发和填充数据库95
第4章 设置和物理设计95
4.1 系统规模考虑事项96
4.1.1 计算数据卷96
4.1.2 确定应用复杂度97
4.1.3 估计并发用户数99
4.1.4 评估系统可用性需求99
4.2 系统配置考虑100
4.2.1 需要的内存100
4.2.2 集成式还是分布式100
4.2.3 使用的存储系统102
4.2.4 处理器103
4.2.5 高可用性配置104
4.3 软件安装和配置105
4.3.1 开发环境软件需求106
4.3.2 测试和产品系统软件需求109
4.3.3 操作系统109
4.3.4 SQL Server关系数据库设置110
4.3.5 Analysis Services设置113
4.3.6 Integration Services设置114
4.3.7 Reporting Services设置115
4.4 物理数据仓库数据库设计116
4.4.1 代理键117
4.4.2 字符串列117
4.4.3 空或非空118
4.4.4 插入未知成员行118
4.4.5 数据表和列的扩展属性118
4.4.6 常规事务列118
4.4.7 索引和列约束条件119
4.4.8 创建数据表视图121
4.4.9 事实表分区122
4.4.10 聚合数据表128
4.4.11 中间表129
4.4.12 元数据设置129
4.5 小结129
第5章 设计ETL系统131
5.1 SQL Server Integration Services简介132
5.1.1 BI Studio Integration Services工具概述133
5.1.2 控制流134
5.1.3 数据流136
5.1.4 动态程序包概念141
5.1.5 事件处理程序143
5.2 高级计划144
5.2.1 开发第一个概要性高级映射144
5.2.2 构建沙箱源系统146
5.2.3 执行数据记录147
5.2.4 完成源到目的的映射147
5.2.5 加载频率148
5.2.6 多少历史信息148
5.2.7 使用分区149
5.2.8 历史加载和增量加载150
5.2.9 开发提取数据的策略151
5.2.10 人员和机构的重复数据删除155
5.2.11 开发维度分布的策略156
5.3 更新Analysis Services数据库157
5.4 ETL系统物理设计158
5.4.1 系统体系结构和Integration Services158
5.4.2 中间表区域159
5.4.3 程序包存储159
5.4.4 程序包命名约定160
5.5 开发详细的规范160
5.6 小结162
第6章 开发ETL系统163
6.1 起始164
6.1.1 创建解决方案、项目和数据源165
6.1.2 程序包模板166
6.1.3 主程序包和子程序包167
6.2 维度处理169
6.2.1 维度处理的基本要求169
6.2.2 提取修改后的记录176
6.2.3 渐变维度178
6.2.4 重复数据删除和模糊变换186
6.3 事实处理188
6.3.1 提取事实数据188
6.3.2 提取事实的更新和删除190
6.3.3 清除事实数据191
6.3.4 检查数据质量及暂停程序的执行192
6.3.5 转换事实数据197
6.3.6 代理键管道200
6.3.7 加载事实数据203
6.3.8 Analysis Services的处理过程208
6.4 补充介绍208
6.4.1 审核系统208
6.4.2 主程序包211
6.4.3 程序包事件处理214
6.4.4 单元测试214
6.5 小结215
第7章 设计Analysis Services OLAP数据库217
7.1 选择Analysis Services的原因218
7.1.1 聚合管理218
7.1.2 聚合导航219
7.1.3 针对每种度量的求和逻辑219
7.1.4 查询性能220
7.1.5 计算220
7.1.6 使用Analysis Services的其他原因220
7.1.7 不使用Analysis Services的原因222
7.2 设计OLAP结构223
7.2.1 起始223
7.2.2 创建项目和数据源视图226
7.2.3 维度设计229
7.2.4 创建和编辑维度232
7.2.5 创建和编辑多维数据集242
7.3 物理设计的考虑因素256
7.3.1 存储模式:MOLAP、HOLAP、ROLAP257
7.3.2 设计聚合258
7.3.3 分区计划259
7.3.4 部署计划261
7.3.5 历史处理计划261
7.3.6 增量处理计划262
7.4 小结265
第Ⅲ部分 商业智能应用程序的开发第8章 商业智能应用程序269
8.1 商业智能的基本概念270
8.1.1 标准报表271
8.1.2 分析应用程序271
8.1.3 BI应用程序开发人员272
8.2 商业智能应用程序的价值274
8.3 交付平台选项275
8.4 BI应用程序的开发过程276
8.4.1 应用程序的说明276
8.4.2 应用程序的开发284
8.4.3 维护288
8.5 小结289
第9章 在Reporting Services中构建BI应用程序291
9.1 报表高层次的体系结构292
9.1.1 回顾报表的业务需求293
9.1.2 Reporting Services的体系结构295
9.1.3 使用Reporting Services作为一个标准的报表工具297
9.1.4 Reporting Services的评价303
9.2 报表的构建和传送304
9.2.1 规划和准备304
9.2.2 创建报表306
9.2.3 BI门户316
9.2.4 报表的运行320
9.3 小结322
第10章 数据挖掘的加入325
10.1 数据挖掘的定义326
10.1.1 基本的数据挖掘的术语327
10.1.2 数据挖掘的业务应用328
10.1.3 角色和责任334
10.2 SQL Server数据挖掘体系结构的概述334
10.2.1 数据挖掘设计环境335
10.2.2 构建、部署和处理336
10.2.3 挖掘模型的访问336
10.2.4 Integration Services和数据挖掘337
10.2.5 额外的功能337
10.2.6 体系结构的总结338
10.3 Microsoft数据挖掘的算法338
10.3.1 决策树339
10.3.2 贝叶斯算法340
10.3.3 聚类341
10.3.4 顺序分析和聚类分析341
10.3.5 时间序列341
10.3.6 关联341
10.3.7 神经网络342
10.4 数据挖掘的过程342
10.4.1 业务阶段343
10.4.2 数据挖掘阶段344
10.4.3 运行阶段350
10.4.4 元数据351
10.5 数据挖掘的示例352
10.5.1 示例学习:给城市分类352
10.5.2 案例研究:产品推荐360
10.6 小结375
第Ⅳ部分 DW/BI系统的部署和管理第11章 使用现有的数据仓库进行工作379
11.1 事情的现状379
11.1.1 数据质量380
11.1.2 集市混乱381
11.1.3 业务认可的混乱381
11.1.4 基础设施的混乱382
11.1.5 行政和机构上的问题382
11.1.6 完全健康383
11.2 从SQL Server 2000转换到SQL Server 2005383
11.2.1 关系数据仓库383
11.2.2 Integration Services384
11.2.3 Analysis Services384
11.2.4 Reporting Services385
11.2.5 数据挖掘385
11.3 与非SQL Server 2005组件的集成385
11.3.1 关系数据库的替换386
11.3.2 Integration Services的替换387
11.3.3 Analysis Services OLAP、数据挖掘或Reporting Services的替换388
11.3.4 非Microsoft的即席查询工具的使用388
11.4 小结390
第12章 安全391
12.1 确定安全管理员392
12.2 保护硬件393
12.3 保护操作系统393
12.4 保护开发环境394
12.5 保护数据395
12.5.1 向内部用户提供开放的访问395
12.5.2 分条列出敏感数据396
12.5.3 保护各种类型的数据访问396
12.5.4 您该做些什么401
12.5.5 Windows集成安全认证402
12.5.6 Analysis Services的安全403
12.5.7 关系DW的安全412
12.5.8 Reporting Services安全419
12.5.9 Integration Services安全421
12.6 使用情况的监控422
12.7 保护隐私422
12.8 小结423
第13章 元数据规划425
13.1 元数据的基础426
13.1.1 元数据的目标426
13.1.2 元数据的存储空间427
13.2 元数据标准428
13.3 SQL Server 2005元数据430
13.3.1 Cross-Tool组件434
13.3.2 关系引擎的元数据434
13.3.3 Analysis Services435
13.3.4 Integration Services436
13.3.5 Reporting Services436
13.3.6 外部元数据的源437
13.3.7 对SQL Server元数据的期待438
13.4 实用的元数据方法438
13.4.1 元数据策略的创建439
13.4.2 业务元数据报表440
13.4.3 过程元数据报表448
13.4.4 技术元数据报表449
13.4.5 过程元数据的管理449
13.4 小结449
第14章 部署451
14.1 系统部署452
14.1.1 部署前的测试452
14.1.2 部署465
14.2 数据仓库和BI文档472
14.2.1 核心的说明472
14.2.2 额外的文档473
14.2.3 额外的功能474
14.3 用户的培训474
14.3.1 培训的开发475
14.3.2 培训的传递477
14.4 用户支持478
14.5 台式计算机的准备和配置479
14.6 小结480
第15章 运行与维护483
15.1 提供用户支持484
15.1.1 BI门户的维护485
15.1.2 BI应用程序的扩充485
15.2 系统管理486
15.2.1 ETL程序包的执行486
15.2.2 商业智能系统的监控489
15.2.3 磁盘空间的管理498
15.2.4 查询的取消500
15.2.5 服务和可用性的管理501
15.2.6 DW/BI系统的性能调整502
15.2.7 Analysis Services的性能调整502
15.2.8 分区的管理505
15.2.9 备份和恢复510
15.3 小结515
第Ⅴ部分 DW/BI系统的扩充519
第16章 成长的管理519
16.1 生命周期的迭代:成长的DW/BI系统520
16.1.1 业务需求和项目管理520
16.1.2 技术跟踪520
16.1.3 数据的跟踪521
16.1.4 应用程序的跟踪521
16.1.5 部署、维护和成长521
16.2 销售和期望的管理522
16.2.1 利害关系人522
16.2.2 定量的技术523
16.2.3 定性的技术524
16.3 系统互连528
16.3.1 下游系统528
16.3.2 主数据528
16.3.3 BI Web服务529
16.4 小结530
第17章 实时商业智能531
17.1 为(和不为)实时数据创建事例532
17.1.1 让实时数据的传送变得困难的原因532
17.1.2 什么让实时数据变得具有价值533
17.1.3 您该做些什么534
17.2 实时地执行报表536
17.2.1 通过缓存向报表提供服务536
17.2.2 从Integration Services程序包中获取报表537
17.3 实时地加载DW/BI系统539
17.3.1 集成的方法539
17.3.2 实时层540
17.4 使用Analysis Services来传送实时数据543
17.4.1 从标准化的数据中构建多维数据集543
17.4.2 主动缓存544
17.4.3 通过Analysis Services实时地使用Integration Services554
17.5 小结555
第18章 目前的需要以及未来的展望557
18.1 DW/BI项目中的很大风险557
18.1.1 阶段Ⅰ——需求、现实、规划和设计558
18.1.2 阶段Ⅱ——数据库和应用程序的开发558
18.1.3 阶段Ⅲ——DW/BI系统的部署和管理559
18.1.4 阶段Ⅳ——DW/BI系统的扩充559
18.2 Microsoft BI工具集中受欢迎的部分560
18.3 未来的方向:改进的空间560
18.3.1 查询工具561
18.3.2 元数据561
18.3.3 关系数据库引擎561
18.3.4 Analysis Services562
18.3.5 分析应用程序562
18.3.6 集成562
18.4 小结563