图书介绍
实战大数据 MATLAB数据挖掘详解与实践PDF|Epub|txt|kindle电子书版本网盘下载
![实战大数据 MATLAB数据挖掘详解与实践](https://www.shukui.net/cover/50/30444689.jpg)
- 许国根,贾瑛著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302451013
- 出版时间:2017
- 标注页数:548页
- 文件大小:60MB
- 文件页数:566页
- 主题词:Matlab软件
PDF下载
下载说明
实战大数据 MATLAB数据挖掘详解与实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1篇 关于数据挖掘3
第1章 绪论3
1.1数据挖掘概述4
1.2数据挖掘的分类6
1.3数据挖掘的过程7
1.4数据挖掘的任务9
1.5数据挖掘的对象11
1.5.1数据库11
1.5.2文本13
1.5.3图像与视频数据13
1.5.4 Web数据14
1.6数据挖掘建模方法14
1.6.1业务理解15
1.6.2数据理解16
1.6.3数据准备16
1.6.4建模17
1.6.5评估18
1.6.6部署19
1.7数据挖掘的应用19
1.7.1在金融领域中的应用19
1.7.2在零售业中的应用20
1.7.3在电信业中的应用21
1.7.4在管理中的应用22
1.7.5在化学研究领域中的应用22
1.7.6在材料研究、生产方面的应用23
1.7.7在机械故障诊断与监测中的应用24
1.7.8在医疗领域中的应用25
第2篇 数据挖掘算法29
第2章 决策树算法29
2.1决策树算法概述30
2.2决策树基本算法30
2.3 ID3算法32
2.4 C4.5算法34
2.5 CART算法35
2.6决策树的评价标准36
2.7决策树的剪枝及优化37
2.8基于 MATLAB的决策树分析38
第3章 人工神经网络算法47
3.1人工神经网络概述48
3.2人工神经网络的基本模型48
3.2.1神经元48
3.2.2传递函数49
3.2.3人工神经网络的分类50
3.3 BP神经网络50
3.3.1 BP人工神经网络结构50
3.3.2 BP人工神经网络的学习算法50
3.4 RBF神经网络51
3.4.1 RBF网络结构51
3.4.2 RBF人工神经网络的学习算法52
3.5 SOM神经网络53
3.5.1 SOM神经网络结构53
3.5.2 SOM神经网络学习算法53
3.6反馈型神经网络(Hopfield)54
3.6.1 Hopfield网络的拓扑结构54
3.6.2 Hopfield网络的学习算法55
3.7基于MATLAB的神经网络方法56
3.7.1信息表达方式56
3.7.2网络模型选择56
3.7.3网络参数选择56
3.7.4学习训练算法选择56
3.7.5系统仿真的性能对比56
第4章 进化算法65
4.1概述66
4.2进化算法的基本原理67
4.2.1编码67
4.2.2适应度函数68
4.2.3遗传算子69
4.2.4基因算法的特点71
4.3基因算法的主要步骤71
4.4基本遗传算法72
4.4.1遗传算法的基本流程72
4.4.2控制参数选择73
4.5进化规划算法74
4.5.1变异算子75
4.5.2选择算子75
4.6进化策略计算75
4.6.1进化策略算法的基本流程76
4.6.2算法的构成要素76
4.7量子遗传算法79
4.7.1基本概念79
4.7.2量子遗传算法流程80
4.7.3量子算法中的控制参数81
4.8人工免疫算法83
4.8.1人工免疫算法的生物学基础83
4.8.2生物免疫基本原理85
4.8.3人工免疫算法的基本概念86
4.8.4免疫算子87
4.8.5免疫算法与免疫系统的对应89
4.8.6人工免疫算法与遗传算法的比较90
4.9基于MATLAB的进化算法91
第5章 统计分析方法99
5.1假设检验100
5.1.1随机误差的判断100
5.1.2系统误差的检验101
5.2回归分析103
5.2.1一元线性回归分析103
5.2.2多元线性回归分析106
5.2.3非线性回归分析108
5.2.4虚拟及离散变量回归模型110
5.2.5异常点、高杠杆点和强影响观测值110
5.2.6回归假设检验111
5.3二项逻辑(logistic)回归112
5.3.1二项逻辑回归模型112
5.3.2显著性检验114
5.3.3回归方程的拟合优度检验115
5.4方差分析115
5.4.1单因素试验的方差分析115
5.4.2双因素试验的方差分析116
5.5主成分分析118
5.5.1主成分分析的数字模型119
5.5.2主成分计算步骤119
5.5.3主成分估计120
5.5.4主成分筛选121
5.6因子分析121
5.6.1因子分析的一般数学模型121
5.6.2因子模型中公共因子、因子载荷和变量共同度的统计意义123
5.6.3因子分析与主成分分析的联系与区别123
5.6.4 Q型和R型因子分析124
5.7基于MATLAB的统计分析方法124
第6章 贝叶斯网络方法155
6.1贝叶斯定理、先验和后验156
6.2贝叶斯网络157
6.3贝叶斯网络学习158
6.3.1贝叶斯网络的结构学习158
6.3.2贝叶斯网络的参数学习158
6.4主要贝叶斯网络模型160
6.4.1朴素贝叶斯网络160
6.4.2 TAN贝叶斯网络161
6.4.3无约束贝叶斯网络162
6.5基于MATLAB的贝叶斯网络方法162
第7章 支持向量机177
7.1支持向量机概述178
7.2核函数180
7.3基于MATLAB的支持向量机方法182
第8章 关联分析185
8.1概述186
8.1.1关联规则的主要概念186
8.1.2关联规则的种类187
8.1.3关联规则的价值衡量的方法187
8.2 Apriori关联规则算法188
8.3基于分类搜索的关联规则算法189
8.3.1基于分类搜索的关联规则算法特点189
8.3.2算法流程与实现190
8.3.3数据更新实现190
8.4时序关联规则算法191
8.5多值属性关联规则算法192
8.5.1静态离散属性关联规则192
8.5.2动态离散关联规则193
8.5.3基于距离的关联规则193
8.6增量关联规则算法193
8.7基于关联规则的分类算法194
8.8模糊关联分类算法195
8.8.1属性的模糊划分195
8.8.2模糊关联的定义195
8.9关联规则的评价196
8.9.1支持度—置信度框架196
8.9.2基于主观因素的主观度量197
8.10辛普森悖论197
8.11基于MATLAB的关联规则分析198
第9章 其他数据挖掘方法201
9.1近邻法202
9.2 K-means聚类203
9.3基于MATLAB的近邻法及K-means聚类法206
第3篇 数据挖掘相关技术213
第10章 数据仓库213
10.1概述214
10.1.1数据仓库重要特性214
10.1.2数据仓库中几个重要概念216
10.2数据仓库设计218
10.2.1数据仓库的总体结构218
10.2.2数据仓库的基本功能层219
10.2.3数据仓库技术220
10.2.4数据仓库设计221
10.2.5数据仓库设计步骤221
10.3数据仓库的开发应用222
10.3.1数据仓库概念模型设计与开发223
10.3.2数据仓库的逻辑模型设计226
10.3.3数据仓库物理模型的设计230
10.4数据仓库的技术管理232
10.5 OLAP技术233
10.5.1基本概念233
10.5.2多维分析234
10.5.3维的层次关系235
10.5.4维的类关系235
10.5.5 OLAP与数据仓库的关系235
10.6基于MATLAB的数据仓库开发技术237
10.6.1数据库工具箱237
10.6.2可视查询生成器239
10.6.3数据的存取类型247
10.6.4数据输入和输出252
第11章 模糊集理论257
11.1模糊集合258
11.1.1隶属度函数258
11.1.2模糊集运算260
11.1.3 λ截集260
11.2模糊关系261
11.3模糊聚类262
11.3.1数据标准化263
11.3.2相似系数和距离263
11.3.3模糊聚类分析266
11.3.4模糊K-均值聚类267
11.4基于MATLAB的模糊集处理技术267
第12章 粗糙集技术281
12.1粗糙集理论的基本概念282
12.1.1知识表达系统和决策表282
12.1.2等价关系282
12.1.3等价划分283
12.1.4上近似集和下近似集283
12.1.5粗糙集284
12.1.6粗糙集的非确定性的精确度a A(Y)和粗糙度ρ A(Y)284
12.2分类规则的形成284
12.3知识的约简285
12.3.1决策表的一致性285
12.3.2属性约简285
12.3.3分辨矩阵与分辨函数286
12.4模糊集与粗糙集287
12.5基于MATLAB的粗糙集处理方法287
第13章 目标优化技术291
13.1目标优化概述292
13.2极值问题293
13.3无约束非线性规划293
13.3.1梯度下降法294
13.3.2共轭梯度法295
13.3.3牛顿法295
13.4有约束非线性规划295
13.5大规模优化问题的分解算法296
13.5.1问题的描述296
13.5.2目标协调法297
13.5.3模型协调法298
13.5.4混合协调法298
13.6其他优化方法299
13.7基于MATLAB的目标优化方法300
第14章 可视化技术307
14.1可视化技术概述308
14.2可视化技术分类309
14.2.1数据可视化309
14.2.2科学计算可视化309
14.2.3信息可视化309
14.2.4知识可视化310
14.3多维数据可视化310
14.3.1平行坐标表示法311
14.3.2雷达图312
14.3.3树形图313
14.3.4三角多项式图314
14.3.5散点图315
14.3.6星座图316
14.3.7基于像素的高维数据的可视化318
14.3.8基于非线性变换的图表示优化318
14.3.9高维数据降维319
14.4图形的特征分析321
14.4.1平行坐标下的聚簇分析321
14.4.3图形特征提取中的特征排序问题323
14.5基于多元图的图形分类方法324
14.5.1单原型图形分类器324
14.5.2基于平行坐标的平行筛可视化分类方法325
14.5.3基于平行坐标的贝叶斯可视化分类方法325
14.6基于色度学空间的多元图表示326
14.7基于MATLAB的数据可视化技术327
第15章 公式发现341
15.1公式发现概述342
15.2公式发现系统中的知识342
15.2.1规则一(函数规则)343
15.2.2规则二(导数规则)344
15.2.3多维函数扩展规则345
15.2.4规则三346
15.3基于MATLAB的公式发现347
第16章 多媒体数据挖掘技术349
16.1多媒体数据挖掘技术概述350
16.1.1数据类型350
16.1.2多媒体数据库管理系统(MM-DBMS)351
16.2文本挖掘352
16.2.1基于关键字的关联分析354
16.2.2文档分类分析354
16.3图像挖掘360
16.4视频挖掘361
16.4.1结构挖掘361
16.4.2运动挖掘361
16.4.3趋势挖掘362
16.5音频挖掘362
16.6复合类型数据的挖掘363
第17章 Web数据挖掘技术365
17.1 Web数据挖掘技术概述366
17.2 Web内容挖掘366
17.2.1爬虫367
17.2.2虚拟Web视图367
17.2.3个性化368
17.3 Web结构挖掘369
17.3.1 PageRank369
17.3.2 Clever369
17.4 Web使用挖掘369
17.4.1预处理370
17.4.2数据结构370
17.4.3模式发现370
17.4.4模式发现371
17.4.5基于组织协同进化的Web日志挖掘算法371
第4篇 数据挖掘应用实战377
第18章 数据统计特性377
18.1数据关系发现378
18.2频率和众数378
18.3百分位数(percentile)378
18.4中心度量378
18.5散布程度度量379
18.6数据的分布描述380
18.7数据的概率分布383
第19章 数据预处理385
19.1数据预处理完毕386
19.2数据清理386
19.2.1填补缺失数据386
19.2.2消除噪声数据387
19.2.3实现数据一致性388
19.3数据集成与转换388
19.3.1数据集成388
19.3.2数据转换389
19.4数据归约与压缩390
19.4.1数据归约390
19.4.2数据压缩395
19.4.3数值归约395
19.5数值数据的概念分层与离散化396
19.5.1概念分层396
19.5.2概念分层的类型397
19.5.3数值数据离散化398
19.5.4分类数据的概念分层399
19.6例题399
第20章 分类411
20.1分类概述412
20.2方法412
20.3例题415
第21章 预测421
21.1回归分析422
21.1.1逐步回归422
21.1.2岭回归424
21.1.3主成分回归分析425
21.2时间序列预测模型425
21.2.1时间序列的特征量426
21.2.2平稳时间序列预测模型426
21.3马尔可夫链429
21.4灰色系统方法430
21.4.1灰色系统的基本概念430
21.4.2灰色序列生成算子431
21.4.3灰色分析433
21.5例题438
第22章 聚类459
22.1聚类分析概述460
21.2聚类分析中的数据类型461
22.3相似性度量463
22.3.1属性间的相似性度量464
22.3.2对象间的相似性度量465
22.3.3相异度矩阵465
22.4聚类的特征468
22.5聚类准则469
22.6划分方法470
22.7层次方法471
22.7.1利用层次方法的平衡迭代归约及聚类473
22.7.2利用代表点聚类474
22.8基于密度的方法474
22.9基于网格的方法476
22.10基于模型的聚类方法477
22.11基于目标函数的方法478
22.11.1样本与类之间的距离478
22.11.2类内距离479
22.11.3类与类之间的距离479
22.12离群点检测480
22.12.1基于统计的离群点检测方法481
22.12.2基于距离的离群点检测方法482
22.12.3基于相对密度的离群点检测方法483
22.12.4基于聚类的离群点检测方法484
22.12.5离群点挖掘方法的评估486
22.13聚类有效性487
22.13.1内部质量评价准则487
22.13.2外部质量评价准则489
22.14例题489
第23章 时序数据挖掘505
23.1基本定义506
23.2时序数据挖掘参数507
23.3时序关联规则507
23.3.1事务间关联规则508
23.3.2情节规则508
23.3.3序列关联规则508
23.3.4日历关联规则509
23.4时间序列挖掘509
23.4.1时间序列分析509
23.4.2趋势分析509
23.4.3相似性搜索511
23.4.4周期分析512
23.5时间序列分段线性表示512
23.6时间序列的预测513
23.7例题513
第24章 关联规则挖掘527
24.1关联规则的类型及挖掘算法528
24.2基于组织进化的关联规则挖掘528
24.2.1组织的定义528
24.2.2组织适应度的计算529
24.2.3组织进化算子529
24.2.4算法步骤529
24.3基于组织层次进化的关联规则挖掘530
24.3.1聚合算子530
24.3.2进化种群pe和最优种群pb530
24.3.3算法步骤530
24.4多维关联规则挖掘531
24.4.1染色体的编码531
24.4.2亲和度函数的构造531
24.4.3算法步骤532
24.5关联规则扩展532
24.5.1多层次关联规则532
24.5.2多维度关联规则533
24.5.3定量关联规则533
24.5.4基于约束的关联规则534
24.6例题534
参考文献548