图书介绍
数据仓库与数据挖掘技术原理及应用PDF|Epub|txt|kindle电子书版本网盘下载
- 姚家奕编著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121093982
- 出版时间:2009
- 标注页数:433页
- 文件大小:89MB
- 文件页数:449页
- 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材
PDF下载
下载说明
数据仓库与数据挖掘技术原理及应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据仓库与数据挖掘概述1
1.1 从数据库到数据仓库2
1.1.1 数据库遇到的困境2
1.1.2 操作型系统和分析型系统的分离7
1.1.3 数据仓库的产生9
1.1.4 传统数据库与数据仓库的区别12
1.2 数据挖掘13
1.2.1 数据挖掘的产生13
1.2.2 数据挖掘的发展历程15
1.2.3 数据挖掘与数据仓库的关系17
1.3 关联学科和技术介绍18
1.3.1 统计学18
1.3.2 人工智能技术与机器学习19
1.3.3 商业智能20
1.3.4 OLAP(Online Analytical Process,联机分析处理)20
1.4 数据仓库产品介绍21
1.4.1 Business Objects21
1.4.2 Oracle22
1.4.3 IBM22
1.4.4 Sybase23
1.4.5 Informix24
1.4.6 NCR24
1.4.7 SAS25
1.4.8 CA25
本章小结26
本章习题26
第2章 数据仓库与数据挖掘的应用和发展27
2.1 金融行业的应用28
2.1.1 银行28
2.1.2 证券30
2.1.3 保险33
2.2 通信与安全行业的应用36
2.2.1 电信36
2.2.2 信息安全39
2.3 生产制造与零售行业40
2.3.1 生产制造41
2.3.2 零售42
2.4 医疗与生物医学行业44
2.4.1 医疗44
2.4.2 生物医学46
2.5 其他行业48
2.5.1 公安48
2.5.2 税务50
2.5.3 竞技运动50
2.6 数据仓库与数据挖掘技术的发展趋势52
2.6.1 数据仓库的发展趋势52
2.6.2 数据挖掘技术的发展趋势56
本章小结61
本章习题61
第3章 数据仓库的基本原理62
3.1 数据仓库的体系结构63
3.1.1 数据仓库体系的三个层次63
3.1.2 数据仓库体系结构的基本特点65
3.1.3 数据仓库体系结构的计算模式66
3.2 数据仓库的基本概念66
3.2.1 数据仓库中的数据66
3.2.2 数据仓库处理过程中的关键名词69
3.2.3 数据集市(Data Mart)70
3.3 数据仓库的特点75
3.3.1 面向主题76
3.3.2 数据的集成性77
3.3.3 数据的非易失性77
3.3.4 数据的时变性78
3.4 数据仓库的数据组织79
3.4.1 数据仓库的数据组织结构79
3.4.2 数据的颗粒度80
3.4.3 数据的分割82
3.4.4 数据仓库的数据组织形式83
3.4.5 数据追加技术83
3.4.6 数据仓库中的数据清理85
3.5 数据仓库的数据管理86
3.5.1 元数据的管理86
3.5.2 外部数据与非结构数据的管理87
本章小结89
本章习题89
第4章 OLAP的基本原理90
4.1 OLAP的体系结构91
4.2 OLAP中的基本概念93
4.2.1 OLAP设计的基本术语93
4.2.2 OLAP服务管理的基本术语98
4.2.3 OLAP与数据仓库、OLTP的关系102
4.3 OLAP的基本特征与功能104
4.3.1 OLAP的基本特征104
4.3.2 OLAP的基本功能105
4.4 OLAP的分类107
4.4.1 MOLAP107
4.4.2 ROLAP109
4.4.3 HOLAP(Hybrid OLAP)111
4.4.4 MOLAP与ROLAP的比较111
4.5 OLAP的展现114
4.5.1 OLAP的展现方式114
4.5.2 OLAP的展现方法115
本章小结117
本章习题117
第5章 数据挖掘的基本原理118
5.1 数据挖掘的概念119
5.1.1 数据挖掘的形式化定义121
5.1.2 数据挖掘的技术定义122
5.1.3 数据挖掘的商业定义123
5.1.4 数据挖掘与OLAP的关系124
5.2 数据挖掘的体系结构126
5.3 数据挖掘的基本功能126
5.3.1 概念描述127
5.3.2 信息摘要127
5.3.3 信息抽取128
5.3.4 元数据挖掘128
5.4 数据挖掘的对象128
5.5 数据挖掘的步骤与过程模型130
5.5.1 数据挖掘的步骤131
5.5.2 数据挖掘的过程模型132
5.6 数据挖掘的分类138
5.6.1 关联分析(Association)139
5.6.2 聚类分析(Clustering)140
5.6.3 分类分析(Classification)141
5.6.4 序列分析及时间序列(Sequence Analysis and Time Sequence)142
5.6.5 其他分析143
本章小结143
本章习题144
第6章 关联规则分析算法原理与应用145
6.1 关联规则的典型应用146
6.2 关联规则挖掘算法的基本原理148
6.2.1 关联规则算法的基本概念148
6.2.2 挖掘频繁项集的经典算法——Apriori算法150
6.2.3 生成关联规则156
6.2.4 预测157
6.3 关联规则挖掘算法的使用158
6.3.1 关联规则算法的参数158
6.3.2 DMX查询159
6.3.3 模型内容161
6.3.4 解释模型162
6.4 关联规则挖掘的优化算法162
6.4.1 ApriioriTid算法162
6.4.2 AprioriHybrid算法163
6.4.3 基于粗糙集的关联规则算法164
6.4.4 具有自适应能力的动态递增的关联规则算法165
6.4.5 关联规则的增量式更新算法166
6.4.6 多层关联规则发现算法168
6.4.7 约束性关联规则发现算法169
本章小结172
本章习题172
第7章 聚类分析算法原理与应用173
7.1 聚类分析的典型应用174
7.2 聚类算法的基本原理175
7.2.1 聚类分析的基本概念177
7.2.2 聚类分析的基本方法181
7.3 聚类分析算法的使用184
7.3.1 聚类分析算法的参数184
7.3.2 聚类模型的使用186
7.4 聚类分析方法的优化算法190
7.4.1 聚类分析的基本优化算法190
7.4.2 面向流数据和孤立点挖掘的新型聚类算法195
本章小结199
本章习题199
第8章 分类分析算法原理与应用200
8.1 分类分析算法的典型应用201
8.2 分类分析算法的基本原理201
8.2.1 分类分析算法的基本概念202
8.2.2 决策树基本算法介绍203
8.3 基于信息论(Information Theory)的分类分析算法206
8.3.1 概念与定义207
8.3.2 ID3分类算法208
8.3.3 C4.5分类算法209
8.4 分类与回归树算法212
8.4.1 构建决策树213
8.4.2 决策树修剪(Pruning)215
8.4.3 决策树评估(Estimate)218
本章小结219
本章习题220
第9章 序列模式分析算法原理与应用221
9.1 序列模式分析的典型应用222
9.2 序列模式分析的基本原理224
9.2.1 序列模式分析的基本概念224
9.2.2 序列模式的发现步骤226
9.3 序列模式分析典型算法的使用228
9.4 序列模式分析的新算法235
9.4.1 基于Apriori的候选码生成——测试的方法235
9.4.2 基于垂直格式的候选码生成——测试的方法236
9.4.3 模式增长方法238
本章小结239
本章习题239
第10章 Microsoft SQL Server 2000数据仓库基本操作240
10.1 Analysis Manager的配置241
10.1.1 注册服务器241
10.1.2 创建数据库241
10.2 数据源的管理241
10.2.1 指定ODBC数据源242
10.2.2 指定SQL Server数据源244
10.3 多维数据集和维度的创建245
10.3.1 创建维度245
10.3.2 创建多维数据集252
10.4 管理与使用权限的设置255
10.4.1 系统管理员的安全性控制255
10.4.2 数据库角色定义与管理256
10.4.3 多维数据集角色的管理261
10.5 数据库的存档与恢复265
10.5.1 数据库的存档265
10.5.2 数据库的恢复265
10.6 DTS在数据仓库中的应用267
10.6.1 DTS概述267
10.6.2 数据导入/导出工具267
10.6.3 DTS中的数据转换271
本章小结272
本章习题273
第11章 Microsoft SQL Server 2000 OLAP的基本设计274
11.1 多维数据集的建立275
11.1.1 度量值的添加275
11.1.2 时间维度的建立275
11.1.3 雪花模型维度的建立277
11.1.4 星型模型维度的建立278
11.1.5 父子维度的建立278
11.1.6 完成多维数据集的创建279
11.2 多维数据集的编辑与管理279
11.2.1 维度的编辑280
11.2.2 多维数据集的编辑282
11.3 多维数据集的设计存储和处理284
11.4 多维数据集分析模式的应用286
11.4.1 直接使用“Analysis Manager”进行数据浏览以及OLAP的实施286
11.4.2 使用Excel作为前端分析工具289
11.4.3 使用OLAP的Web动态数据透视292
本章小结298
本章习题298
第12章 Microsoft SQL Server 2000 OLAP的高级设计299
12.1 计算成员的建立与应用300
12.1.1 度量值成员的导出与应用300
12.1.2 维度成员的导出与应用302
12.2 计算单元的应用304
12.2.1 建立计算单元304
12.2.2 编辑计算单元308
12.3 “对策”的建立与应用308
12.4 “命名集”的建立与应用313
12.4.1 建立命名集313
12.4.2 命名集在MDX中的应用314
12.5 成员属性与虚拟维度314
12.5.1 成员属性的建立与应用315
12.5.2 虚拟维度的建立与应用316
12.6 多维数据集的分区与合并318
12.6.1 建立多维数据集分区319
12.6.2 编辑分区与筛选条件设置322
12.6.3 分区的合并323
12.7 虚拟多维数据集的建立与应用324
12.8 钻取选项的设置328
12.8.1 钻取的基本概念328
12.8.2 启用多维数据集的钻取功能328
12.8.3 给角色提供钻取权限329
本章小结331
本章习题331
第13章 Microsoft SQL Server 2000 MDX技术332
13.1 MDX概述333
13.1.1 MDX语句的基本概念和组成元素333
13.1.2 MDX语句与SQL语句的比较334
13.2 MDX基础335
13.2.1 MDX语句的基本结构335
13.2.2 成员、元组和集合337
13.2.3 轴维度和切片器维度341
13.2.4 建立多维数据集上下文343
13.3 高级MDX343
13.3.1 指定单元格属性343
13.3.2 生成MDX中的命名集349
13.3.3 生成MDX中的计算成员351
13.3.4 生成MDX中的计算单元352
13.4 Microsoft SQL Server 2000 MDX示例应用程序的使用354
13.5 Analysis Services中的MDX函数356
13.5.1 成员函数356
13.5.2 集合函数364
13.5.3 维度函数372
13.5.4 级别函数374
13.5.5 数值函数376
本章小结381
本章习题381
第14章 Microsoft SQL Server 2000数据挖掘382
14.1 Microsoft SQL Server 2000中的数据挖掘模型383
14.1.1 建立关系数据挖掘模型383
14.1.2 建立OLAP数据挖掘模型394
14.1.3 挖掘模型角色管理401
14.2 Microsoft SQL Server 2005中数据挖掘的改进402
14.2.1 新增加的算法403
14.2.2 易于使用的数据挖掘工具404
14.2.3 简单而强大API404
14.2.4 与同类BI技术的集成404
本章小结405
本章习题405
第15章 数据仓库系统开发方法、 项目管理及实例分析407
15.1 螺旋式开发方法408
15.2 数据仓库项目开发管理410
15.3 数据仓库开发应避免的问题414
15.4 数据仓库系统分析与设计实例417
15.4.1 aCRM系统背景介绍417
15.4.2 aCRM系统目标和需求分析418
15.4.3 aCRM系统体系结构设计423
15.4.4 aCRM系统模型设计424
本章小结432
本章习题433