图书介绍

数据挖掘实践教程PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘实践教程
  • 吴思远主编 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302452042
  • 出版时间:2017
  • 标注页数:361页
  • 文件大小:48MB
  • 文件页数:371页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘实践教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 商业智能1

1.1.1 商业智能概述1

1.1.2 商业智能的发展4

1.2 数据挖掘6

1.2.1 数据挖掘的定义6

1.2.2 数据挖掘的重要性7

1.2.3 数据挖掘的功能8

1.2.4 数据挖掘的方法和经典算法9

1.3 数据仓库12

1.3.1 数据仓库的产生与发展12

1.3.2 数据仓库的定义13

1.3.3 数据仓库与数据挖掘的关系13

第2章 数据仓库与联机分析15

2.1 数据仓库15

2.1.1 数据仓库的基本概念15

2.1.2 数据仓库的体系结构20

2.1.3 数据仓库的数据模型21

2.2 数据仓库的设计步骤23

2.2.1 概念模型设计24

2.2.2 逻辑模型设计26

2.2.3 物理模型设计28

2.2.4 数据仓库的生成31

2.2.5 数据仓库的运行与维护33

2.3 联机分析技术34

2.3.1 OLAP概述34

2.3.2 OLAP多维分析37

2.3.3 MOLAP与ROLAP38

第3章 数据挖掘运用的理论和技术41

3.1 回归分析41

3.1.1 简单线性回归分析42

3.1.2 多元回归分析44

3.1.3 岭回归分析46

3.1.4 logistic回归分析46

3.2 关联规则47

3.2.1 关联规则概述47

3.2.2 Apriori算法50

3.2.3 FP-Growth算法53

3.3 聚类分析55

3.3.1 聚类概述55

3.3.2 聚类中的相异度计算57

3.3.3 基于划分的聚类60

3.3.4 基于层次的聚类61

3.4 决策树分析63

3.4.1 信息论的基本原理63

3.4.2 ID3算法65

3.4.3 C4.5 算法67

3.5 其他分析方法68

第4章 用Excel 2010进行数据分析71

4.1 安装前的准备71

4.1.1 下载表分析工具71

4.1.2 系统要求71

4.2 安装表分析工具72

4.3 配置表分析工具75

4.4 使用表分析工具的要求79

4.5 分析关键影响因素82

4.5.1 影响因素主报表84

4.5.2 影响因素对比报表86

4.6 检测类别86

4.7 从示例填充90

4.8 预测93

4.9 突出显示异常值94

4.10 应用场景分析98

4.10.1 目标查找98

4.10.2 假设101

4.11 预测计算器及可打印计算器104

4.11.1 预测报表104

4.11.2 预测计算器106

4.11.3 可打印计算器107

4.12 购物篮分析108

4.12.1 购物篮捆绑销售商品108

4.12.2 购物篮推荐109

4.12.3 高级参数设置110

第5章 用Excel 2010进行数据挖掘111

5.1 数据挖掘简介111

5.1.1 业务理解111

5.1.2 数据理解112

5.1.3 数据准备112

5.1.4 建立模型112

5.1.5 评价112

5.1.6 实施112

5.1.7 Excel的数据挖掘过程113

5.2 获取外部数据113

5.3 数据准备114

5.3.1 浏览数据114

5.3.2 清除数据118

5.3.3 示例数据124

5.4 数据建模127

5.4.1 分类127

5.4.2 估计132

5.4.3 聚类分析136

5.4.4 关联141

5.4.5 预测145

5.4.6 高级148

5.5 准确性和验证153

5.5.1 准确性图表153

5.5.2 分类矩阵156

5.5.3 利润图158

5.5.4 交叉验证161

5.6 模型用法164

5.6.1 浏览164

5.6.2 文档模型166

5.6.3 查询168

5.7 管理和连接171

5.7.1 管理模型172

5.7.2 连接与跟踪173

第6章 SQL Server 2012数据挖掘174

6.1 SSDT(SQL Server Data Tools)简介174

6.1.1 下载SSDT174

6.1.2 系统要求174

6.2 安装SSDT-BI175

6.3 安装示例数据库180

6.4 SSDT-BI用户界面182

6.5 创建挖掘项目183

6.6 设置数据源185

6.7 设置数据源视图188

6.7.1 新建数据源视图188

6.7.2 使用数据源视图190

6.8 设置挖掘结构193

6.9 处理挖掘模型198

6.10 查看挖掘模型199

6.11 挖掘准确性图表201

6.11.1 输入选择201

6.11.2 提升图202

6.11.3 利润图203

6.11.4 分类矩阵203

6.11.5 交叉验证204

6.12 挖掘模型预测205

第7章 Microsoft数据挖掘算法208

7.1 背景知识208

7.1.1 功能选择208

7.1.2 功能选择的方法209

7.1.3 兴趣性分数209

7.1.4 Shannon平均信息量209

7.1.5 贝叶斯K2算法209

7.1.6 贝叶斯BDE算法210

7.2 Microsoft决策树算法210

7.2.1 使用决策树算法210

7.2.2 决策树算法的原理210

7.2.3 决策树算法参数212

7.3 Microsoft聚类算法214

7.3.1 使用聚类算法214

7.3.2 聚类算法的原理214

7.3.3 聚类算法参数216

7.4 Microsoft关联规则算法218

7.4.1 使用关联规则算法218

7.4.2 关联规则算法的原理218

7.4.3 关联规则算法参数220

7.5 Microsoft时序算法221

7.5.1 使用时序算法221

7.5.2 时序算法的原理222

7.5.3 时序算法参数224

7.6 Microsoft朴素贝叶斯算法226

7.6.1 使用朴素贝叶斯算法226

7.6.2 贝叶斯算法的原理227

7.6.3 贝叶斯算法参数228

7.7 Microsoft神经网络算法229

7.7.1 使用神经网络算法229

7.7.2 神经网络算法的原理229

7.7.3 神经网络算法参数232

第8章 SPSS数据挖掘基础234

8.1 SPSS发展简史234

8.2 SPSS操作入门235

8.2.1 SPSS的启动235

8.2.2 SPSS的退出236

8.3 SPSS的界面236

8.3.1 SPSS的窗口236

8.3.2 SPSS的菜单237

8.4 建立SPSS文件237

8.4.1 SPSS文件类型237

8.4.2 数据录入238

8.4.3 文件的保存与导出238

8.5 SPSS数据的变量属性定义239

8.5.1 变量名称239

8.5.2 变量类型239

8.5.3 变量宽度和小数240

8.5.4 标签和值240

8.5.5 变量缺失值241

8.5.6 变量显示列、对齐方式241

8.5.7 变量测量方式242

8.5.8 变量角色242

8.6 SPSS数据管理242

8.6.1 插入或删除个案242

8.6.2 插入或删除变量243

8.6.3 数据排序243

8.6.4 数据的行列转置245

8.6.5 选取个案245

8.6.6 数据合并246

8.6.7 拆分数据文件248

8.7 SPSS数据转换249

8.7.1 计算产生变量249

8.7.2 对个案内的值计数250

8.7.3 重新编码251

第9章 SPSS数据挖掘常用的统计分析方法254

9.1 基本描述统计254

9.1.1 频数分析254

9.1.2 描述分析257

9.1.3 探索分析259

9.1.4 交叉表分析263

9.2 T检验268

9.2.1 单样本T检验268

9.2.2 独立样本T检验269

9.2.3 配对样本T检验271

9.3 方差分析272

9.3.1 单因素方差分析273

9.3.2 多因素方差分析276

9.3.3 重复测量方差分析282

9.4 多元回归分析286

9.4.1 多元线性回归286

9.4.2 Logistic回归292

9.5 聚类分析297

9.5.1 两步聚类分析298

9.5.2 K-平均值聚类分析301

9.5.3 系统聚类分析304

9.6 相关分析309

9.6.1 线性相关分析309

9.6.2 偏相关分析311

9.7 因子分析313

第10章 数据挖掘实验319

10.1 SQL Server 2012数据挖掘实验319

10.1.1 实践关联规则挖掘方法319

10.1.2 实践聚类挖掘方法331

10.1.3 实践贝叶斯分类方法338

10.2 SPSS数据挖掘实验341

10.2.1 SPSS基本数据管理与数据转换操作341

10.2.2 SPSS均值比较与回归分析操作351

10.2.3 SPSS聚类、相关、因子分析操作356

参考文献361

热门推荐