图书介绍

数据仓库与数据挖掘教程PDF|Epub|txt|kindle电子书版本网盘下载

数据仓库与数据挖掘教程
  • 黄德才编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302434128
  • 出版时间:2016
  • 标注页数:407页
  • 文件大小:146MB
  • 文件页数:423页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 数据仓库概述1

1.1.1 从传统数据库到数据仓库1

1.1.2 数据仓库的4个特征6

1.1.3 数据仓库系统8

1.1.4 数据仓库系统体系结构9

1.1.5 数据仓库数据的粒度与组织11

1.2 数据挖掘概述13

1.2.1 数据挖掘产生的背景13

1.2.2 数据挖掘与知识发现14

1.2.3 数据挖掘的数据来源14

1.2.4 数据挖掘的任务16

1.2.5 数据挖掘的步骤18

1.2.6 数据挖掘的应用20

1.3 数据仓库与数据挖掘22

1.3.1 数据仓库与数据挖掘的区别22

1.3.2 数据仓库与数据挖掘的关系23

1.4 教程章节组织与学时建议24

习题126

第2章 数据仓库原理27

2.1 多数据源问题27

2.2 数据预处理28

2.2.1 数据清洗29

2.2.2 数据变换33

2.2.3 数据归约35

2.3 E-R模型36

2.4 数据仓库的概念模型37

2.4.1 多维数据模型38

2.4.2 维度与粒度41

2.5 数据仓库的逻辑模型42

2.5.1 多维数据库系统42

2.5.2 星形模型45

2.5.3 雪花模型48

2.6 数据仓库的物理模型49

2.6.1 位图索引模型49

2.6.2 广义索引模型51

2.6.3 连接索引模型51

2.6.4 RAID存储结构52

习题254

第3章 数据仓库的设计开发应用56

3.1 数据仓库设计的特点56

3.2 数据仓库系统开发过程57

3.3 数据仓库系统的规划59

3.4 数据仓库的设计63

3.4.1 需求分析63

3.4.2 概念设计66

3.4.3 逻辑设计68

3.4.4 物理设计73

3.5 数据仓库的实施74

3.5.1 数据仓库的创建75

3.5.2 数据的抽取、转换和加载78

3.6 数据仓库系统的开发79

3.6.1 开发任务79

3.6.2 开发方法80

3.6.3 系统测试81

3.7 数据仓库系统的应用81

3.7.1 用户培训82

3.7.2 决策支持82

3.7.3 维护评估83

习题384

第4章 警务数据仓库的实现85

4.1 SQL Server 2008 R285

4.1.1 SQL Server的服务功能85

4.1.2 SQL Server Management Studio86

4.1.3 Microsoft Visual Studio87

4.2 创建集成服务项目与SSIS包90

4.3 配置“旅馆_ETL”数据流任务91

4.3.1 创建“旅馆_ETL”对象91

4.3.2 配置“旅馆_ETL”参数94

4.4 配置“人员_ETL”数据流任务106

4.4.1 创建“人员_ETL”对象106

4.4.2 配置“人员_ETL”参数108

4.5 配置“时间_ETL”数据流任务124

4.5.1 创建“时间_ETL”对象124

4.5.2 配置“时间_ETL”参数124

4.6 配置“入住_ETL”数据流任务134

4.6.1 创建“入住_ETL”对象134

4.6.2 配置“入住_ETL”参数134

4.7 部署前面配置的SSIS包140

4.7.1 将包另存到SSIS服务器141

4.7.2 创建作业代理143

习题4147

第5章 联机分析处理技术149

5.1 OLAP概述149

5.1.1 OLAP的定义149

5.1.2 OLAP的12条准则150

5.1.3 OLAP的简要准则152

5.1.4 OLAP系统的基本结构152

5.2 OLAP的多维分析操作153

5.2.1 切片153

5.2.2 切块155

5.2.3 旋转156

5.2.4 钻取156

5.3 OLAP系统的分类157

5.3.1 多维OLAP157

5.3.2 关系OLAP158

5.3.3 MOLAP与ROLAP的比较158

5.3.4 混合OLAP158

5.4 OLAP、DW与DM的关系159

5.4.1 OLAP、DW与DM的联系159

5.4.2 OLAP、DW与DM的区别160

5.4.3 OLAP与DW的关系160

5.4.4 OLAP与DM的关系161

5.5 DOLAM决策支持系统方案161

习题5163

第6章 警务数据仓库的OLAP应用164

6.1 创建分析服务项目164

6.1.1 进入商业智能开发平台164

6.1.2 创建分析服务项目165

6.2 配置项目的数据源166

6.3 构建数据源视图168

6.4 创建多维数据集169

6.5 配置维的层次结构170

6.5.1 配置日期维的层次170

6.5.2 配置地址维的层次182

6.5.3 配置人员维的层次186

6.5.4 配置旅馆维的层次191

6.6 添加人口来源地址维197

6.7 分析服务项目的部署199

6.8 浏览多维数据集201

习题6205

第7章 数据的属性与相似性206

7.1 数据集的结构206

7.1.1 二维表206

7.1.2 数据矩阵208

7.2 属性的类型208

7.2.1 连续属性209

7.2.2 离散属性211

7.2.3 分类属性211

7.2.4 二元属性211

7.2.5 序数属性212

7.2.6 数值属性213

7.3 相似度与相异度213

7.3.1 数值属性的距离214

7.3.2 分类属性的相似度216

7.3.3 余弦相似度220

7.3.4 混合属性的相异度221

习题7226

第8章 关联规则挖掘228

8.1 关联规则的概念228

8.1.1 基本概念228

8.1.2 项集的性质230

8.2 关联规则的Apriori算法231

8.2.1 发现频繁项集231

8.2.2 产生关联规则235

8.3 FP-增长算法238

8.3.1 算法的背景238

8.3.2 构造FP-树238

8.3.3 生成频繁项集241

8.4 关联规则的评价245

8.4.1 支持度和置信度的不足246

8.4.2 相关性分析247

8.5 序列模式发现算法248

8.5.1 序列模式的概念248

8.5.2 类Apriori算法250

8.6 关联规则其他算法253

8.6.1 频繁项集算法优化253

8.6.2 CLOSE算法254

8.6.3 时态关联规则255

8.6.4 含负项的关联规则255

习题8256

第9章 分类规则挖掘258

9.1 分类问题概述258

9.2 k-最近邻分类法260

9.3 决策树分类方法262

9.3.1 决策树生成框架262

9.3.2 ID3分类方法264

9.3.3 决策树的剪枝270

9.3.4 C4.5 算法271

9.4 贝叶斯分类方法278

9.4.1 贝叶斯定理279

9.4.2 朴素贝叶斯分类器280

9.4.3 朴素贝叶斯分类方法的改进283

9.5 其他分类方法285

习题9286

第10章 聚类分析方法289

10.1 聚类分析原理289

10.1.1 聚类分析概述289

10.1.2 聚类的数学定义290

10.1.3 簇的常见类型291

10.1.4 聚类框架及性能要求293

10.1.5 簇的距离295

10.2 划分聚类算法297

10.2.1 划分聚类框架297

10.2.2 划分聚类的质量297

10.2.3 k-means算法298

10.2.4 空簇与离群点301

10.2.5 k-中心点算法302

10.3 层次聚类方法306

10.3.1 层次聚类策略306

10.3.2 AGNES算法307

10.3.3 DIANA算法309

10.4 密度聚类方法312

10.4.1 基本概念312

10.4.2 算法描述315

10.4.3 计算实例315

10.4.4 算法的性能分析317

10.5 聚类的质量评价317

10.5.1 簇的数目估计318

10.5.2 外部质量评价318

10.5.3 内部质量评价319

10.6 离群点挖掘320

10.6.1 相关问题概述321

10.6.2 基于距离的方法322

10.6.3 基于相对密度的方法326

10.7 其他聚类方法330

习题10333

第11章 混合属性数据的聚类分析335

11.1 混合属性数据集聚类335

11.1.1 混合属性数据普遍存在335

11.1.2 k-prototypes算法336

11.1.3 k-prototypes算法的不足338

11.2 改进的k-prototypes算法339

11.2.1 加权频率最大原型339

11.2.2 离散属性的频率相异度340

11.2.3 改进的k-prototypes算法342

11.3 强连通聚类融合算法342

11.3.1 聚类融合方法342

11.3.2 强连通聚类融合343

11.3.3 聚类融合优化算法346

习题11349

第12章 数据流挖掘与聚类分析350

12.1 数据流挖掘的概念350

12.1.1 数据流的定义350

12.1.2 数据流挖掘的任务351

12.2 数据流处理技术352

12.2.1 概要数据结构352

12.2.2 时间倾斜技术352

12.2.3 数据流聚类的要求356

12.2.4 数据流聚类的一般步骤357

12.3 两层数据流聚类框架357

12.4 三层数据流聚类框架359

12.5 最优2k-近邻聚类算法359

12.5.1 算法设计动因359

12.5.2 定义2k-最近邻集360

12.5.3 在线2k-最近邻集生成362

12.5.4 最优2k-近邻集算法365

12.5.5 最优2k-近邻聚类算法366

12.5.6 实例计算结果368

习题12369

第13章 不确定数据的聚类分析370

13.1 不确定数据挖掘概述370

13.1.1 不确定数据的产生370

13.1.2 不确定数据的种类371

13.1.3 不确定数据的聚类372

13.2 基于相对密度的不确定数据聚类算法374

13.2.1 基于相对密度的聚类思想374

13.2.2 不确定相异度与k-最近邻集375

13.2.3 不确定k-最近邻密度376

13.2.4 RDBCAU算法描述377

13.2.5 计算实例378

13.3 不确定分类属性数据聚类算法381

13.3.1 传统分类属性相似度381

13.3.2 分类属性加权相似度382

13.3.3 分类属性双重加权相似度382

13.3.4 不确定分类属性双重加权相似度384

13.3.5 基于连通分支的不确定分类属性聚类算法385

习题13386

第14章 量子计算与量子遗传聚类算法388

14.1 量子计算与数据挖掘388

14.1.1 量子计算的诞生388

14.1.2 量子计算研究389

14.1.3 量子数据挖掘算法389

14.2 量子计算原理390

14.2.1 量子态与量子比特390

14.2.2 量子门与基本运算391

14.2.3 量子纠缠特性392

14.3 经典量子算法393

14.3.1 量子傅里叶变换393

14.3.2 Shor因子分解算法393

14.3.3 Grover算法393

14.4 基于3D角度编码的量子遗传算法394

14.4.1 量子遗传算法394

14.4.2 量子3D角度编码395

14.4.3 解空间的映射396

14.4.4 量子染色体更新397

14.4.5 量子位的变异398

14.4.6 QGAB3DC算法398

14.5 量子遗传聚类算法399

14.5.1 属性值q分位数与极差399

14.5.2 基于极差的广义加权距离400

14.5.3 量子遗传聚类算法400

习题14402

参考文献404

热门推荐