图书介绍
数据挖掘学习方法PDF|Epub|txt|kindle电子书版本网盘下载
![数据挖掘学习方法](https://www.shukui.net/cover/66/34588961.jpg)
- 王玲编著 著
- 出版社: 北京:冶金工业出版社
- ISBN:9787502475451
- 出版时间:2017
- 标注页数:135页
- 文件大小:28MB
- 文件页数:146页
- 主题词:数据采集-高等学校-教材
PDF下载
下载说明
数据挖掘学习方法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘概述1
1.1 数据挖掘的定义及含义2
1.2 数据挖掘的作用2
1.3 数据挖掘和数据仓库3
1.4 数据挖掘和在线分析处理4
1.5 数据挖掘、机器学习和统计5
1.6 软硬件发展对数据挖掘的影响5
1.7 数据挖掘的类型和研究内容6
1.7.1 描述性数据挖掘6
1.7.2 预测性数据挖掘7
思考题与习题8
第2章 数据仓库9
2.1 什么是数据仓库9
2.1.1 数据仓库的定义与基本特性9
2.1.2 操作数据库系统与数据仓库的区别10
2.1.3 为什么要建立数据仓库11
2.2 数据仓库的一般结构12
2.2.1 体系结构12
2.2.2 数据仓库的运行结构13
2.2.3 事实表和维表14
2.2.4 数据组织结构15
2.3 多维数据的分析16
2.3.1 数据立方体16
2.3.2 多维数据分析的基本操作16
2.4 数据仓库的分析与设计17
2.4.1 需求分析17
2.4.2 数据仓库的概念模型18
2.4.3 数据仓库的逻辑模型19
2.4.4 数据仓库的物理模型21
2.4.5 数据仓库的元数据模型23
2.4.6 数据仓库的索引构建24
2.5 数据仓库的开发过程25
2.5.1 数据仓库的螺旋式开发方法26
2.5.2 数据仓库的开发策略26
思考题与习题27
第3章 聚类28
3.1 K-均值算法28
3.1.1 优化目标29
3.1.2 随机初始化30
3.1.3 选择聚类数30
3.2 层次聚类算法30
3.3 SOM聚类算法31
3.4 FCM聚类算法32
3.5 几种聚类算法的分析32
思考题与习题34
第4章 关联规则挖掘35
4.1 关联规则挖掘35
4.1.1 关联规则提出背景35
4.1.2 关联规则的基本概念35
4.1.3 关联规则的分类36
4.2 关联规则挖掘的相关算法37
4.2.1 Apriori算法预备知识37
4.2.2 Apriori算法的核心思想37
4.2.3 Apriori算法描述38
4.2.4 Apriori算法评价38
4.2.5 Apriori算法改进39
4.2.6 频繁模式树算法40
4.3 关联规则的应用40
4.3.1 关联规则挖掘技术在国内外的应用现状40
4.3.2 关联规则在大型超市中应用的步骤41
思考题与习题43
第5章 决策树算法46
5.1 决策树算法概述46
5.2 决策树表示法47
5.3 决策树学习的学习过程47
5.4 基本的决策树学习算法48
5.5 ID3算法的基本原理49
5.5.1 用熵度量样例的均一性49
5.5.2 用信息增益度量期望的熵降低49
5.6 C4.5算法的基本原理50
5.6.1 信息增益比选择最佳特征50
5.6.2 处理连续数值型特征51
5.6.3 叶子裁剪51
思考题与习题52
第6章 逻辑回归54
6.1 分类问题54
6.2 分类问题建模54
6.3 判定边界56
6.4 代价函数56
6.5 多类分类58
6.6 类偏斜的误差度量59
6.7 查全率和查准率之间的权衡59
思考题与习题60
第7章 多变量线性回归61
7.1 多维特征61
7.2 多变量梯度下降62
7.3 特征缩放63
7.4 学习率63
思考题与习题64
第8章 神经网络65
8.1 神经网络概述66
8.2 神经网络模型的构建67
8.3 神经网络示例69
8.4 神经网络的代价函数70
8.5 反向传播算法71
8.6 梯度检验73
8.7 综合74
思考题与习题74
第9章 支持向量机76
9.1 优化目标76
9.2 支持向量机判定边界78
9.3 核函数79
9.4 逻辑回归与支持向量机82
9.5 支持向量回归82
9.5.1 函数管道思想与不敏感函数82
9.5.2 线性回归83
9.5.3 非线性回归85
思考题与习题85
第10章 降维87
10.1 数据压缩87
10.1.1 将数据从二维降至一维87
10.1.2 将数据从三维降至二维88
10.2 数据可视化88
10.3 主要成分分析89
10.4 主要成分分析算法90
10.5 选择主要成分的数量91
10.6 应用主要成分分析92
思考题与习题93
第11章 异常检测95
11.1 异常点的密度估计95
11.2 异常检测96
11.3 评价一个异常检测系统97
11.4 异常检测与监督学习对比98
11.5 选择特征98
11.6 多元高斯分布99
思考题与习题101
第12章 推荐系统102
12.1 问题形式化102
12.2 基于内容的推荐系统103
12.3 协同过滤算法104
12.4 均值归一化105
思考题与习题106
第13章 大规模数据挖掘算法107
13.1 大型数据集的学习107
13.2 随机梯度下降法108
13.3 微型批量梯度下降109
13.4 随机梯度下降收敛109
13.5 在线学习110
13.6 映射化简和数据并行111
思考题与习题112
第14章 数据挖掘算法的案例分析113
14.1 R语言的简介113
14.2 案例:基于回归树预测海藻数量及分析水样化学参数115
14.2.1 挖掘目标的提出115
14.2.2 模型数据的分析115
14.2.3 建模与仿真123
14.2.4 编程代码130
思考题与习题134
参考文献135