图书介绍

实战大数据 MATLAB数据挖掘详解与实践PDF|Epub|txt|kindle电子书版本网盘下载

实战大数据 MATLAB数据挖掘详解与实践
  • 许国根,贾瑛著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302451013
  • 出版时间:2017
  • 标注页数:548页
  • 文件大小:60MB
  • 文件页数:566页
  • 主题词:Matlab软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

实战大数据 MATLAB数据挖掘详解与实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1篇 关于数据挖掘3

第1章 绪论3

1.1数据挖掘概述4

1.2数据挖掘的分类6

1.3数据挖掘的过程7

1.4数据挖掘的任务9

1.5数据挖掘的对象11

1.5.1数据库11

1.5.2文本13

1.5.3图像与视频数据13

1.5.4 Web数据14

1.6数据挖掘建模方法14

1.6.1业务理解15

1.6.2数据理解16

1.6.3数据准备16

1.6.4建模17

1.6.5评估18

1.6.6部署19

1.7数据挖掘的应用19

1.7.1在金融领域中的应用19

1.7.2在零售业中的应用20

1.7.3在电信业中的应用21

1.7.4在管理中的应用22

1.7.5在化学研究领域中的应用22

1.7.6在材料研究、生产方面的应用23

1.7.7在机械故障诊断与监测中的应用24

1.7.8在医疗领域中的应用25

第2篇 数据挖掘算法29

第2章 决策树算法29

2.1决策树算法概述30

2.2决策树基本算法30

2.3 ID3算法32

2.4 C4.5算法34

2.5 CART算法35

2.6决策树的评价标准36

2.7决策树的剪枝及优化37

2.8基于 MATLAB的决策树分析38

第3章 人工神经网络算法47

3.1人工神经网络概述48

3.2人工神经网络的基本模型48

3.2.1神经元48

3.2.2传递函数49

3.2.3人工神经网络的分类50

3.3 BP神经网络50

3.3.1 BP人工神经网络结构50

3.3.2 BP人工神经网络的学习算法50

3.4 RBF神经网络51

3.4.1 RBF网络结构51

3.4.2 RBF人工神经网络的学习算法52

3.5 SOM神经网络53

3.5.1 SOM神经网络结构53

3.5.2 SOM神经网络学习算法53

3.6反馈型神经网络(Hopfield)54

3.6.1 Hopfield网络的拓扑结构54

3.6.2 Hopfield网络的学习算法55

3.7基于MATLAB的神经网络方法56

3.7.1信息表达方式56

3.7.2网络模型选择56

3.7.3网络参数选择56

3.7.4学习训练算法选择56

3.7.5系统仿真的性能对比56

第4章 进化算法65

4.1概述66

4.2进化算法的基本原理67

4.2.1编码67

4.2.2适应度函数68

4.2.3遗传算子69

4.2.4基因算法的特点71

4.3基因算法的主要步骤71

4.4基本遗传算法72

4.4.1遗传算法的基本流程72

4.4.2控制参数选择73

4.5进化规划算法74

4.5.1变异算子75

4.5.2选择算子75

4.6进化策略计算75

4.6.1进化策略算法的基本流程76

4.6.2算法的构成要素76

4.7量子遗传算法79

4.7.1基本概念79

4.7.2量子遗传算法流程80

4.7.3量子算法中的控制参数81

4.8人工免疫算法83

4.8.1人工免疫算法的生物学基础83

4.8.2生物免疫基本原理85

4.8.3人工免疫算法的基本概念86

4.8.4免疫算子87

4.8.5免疫算法与免疫系统的对应89

4.8.6人工免疫算法与遗传算法的比较90

4.9基于MATLAB的进化算法91

第5章 统计分析方法99

5.1假设检验100

5.1.1随机误差的判断100

5.1.2系统误差的检验101

5.2回归分析103

5.2.1一元线性回归分析103

5.2.2多元线性回归分析106

5.2.3非线性回归分析108

5.2.4虚拟及离散变量回归模型110

5.2.5异常点、高杠杆点和强影响观测值110

5.2.6回归假设检验111

5.3二项逻辑(logistic)回归112

5.3.1二项逻辑回归模型112

5.3.2显著性检验114

5.3.3回归方程的拟合优度检验115

5.4方差分析115

5.4.1单因素试验的方差分析115

5.4.2双因素试验的方差分析116

5.5主成分分析118

5.5.1主成分分析的数字模型119

5.5.2主成分计算步骤119

5.5.3主成分估计120

5.5.4主成分筛选121

5.6因子分析121

5.6.1因子分析的一般数学模型121

5.6.2因子模型中公共因子、因子载荷和变量共同度的统计意义123

5.6.3因子分析与主成分分析的联系与区别123

5.6.4 Q型和R型因子分析124

5.7基于MATLAB的统计分析方法124

第6章 贝叶斯网络方法155

6.1贝叶斯定理、先验和后验156

6.2贝叶斯网络157

6.3贝叶斯网络学习158

6.3.1贝叶斯网络的结构学习158

6.3.2贝叶斯网络的参数学习158

6.4主要贝叶斯网络模型160

6.4.1朴素贝叶斯网络160

6.4.2 TAN贝叶斯网络161

6.4.3无约束贝叶斯网络162

6.5基于MATLAB的贝叶斯网络方法162

第7章 支持向量机177

7.1支持向量机概述178

7.2核函数180

7.3基于MATLAB的支持向量机方法182

第8章 关联分析185

8.1概述186

8.1.1关联规则的主要概念186

8.1.2关联规则的种类187

8.1.3关联规则的价值衡量的方法187

8.2 Apriori关联规则算法188

8.3基于分类搜索的关联规则算法189

8.3.1基于分类搜索的关联规则算法特点189

8.3.2算法流程与实现190

8.3.3数据更新实现190

8.4时序关联规则算法191

8.5多值属性关联规则算法192

8.5.1静态离散属性关联规则192

8.5.2动态离散关联规则193

8.5.3基于距离的关联规则193

8.6增量关联规则算法193

8.7基于关联规则的分类算法194

8.8模糊关联分类算法195

8.8.1属性的模糊划分195

8.8.2模糊关联的定义195

8.9关联规则的评价196

8.9.1支持度—置信度框架196

8.9.2基于主观因素的主观度量197

8.10辛普森悖论197

8.11基于MATLAB的关联规则分析198

第9章 其他数据挖掘方法201

9.1近邻法202

9.2 K-means聚类203

9.3基于MATLAB的近邻法及K-means聚类法206

第3篇 数据挖掘相关技术213

第10章 数据仓库213

10.1概述214

10.1.1数据仓库重要特性214

10.1.2数据仓库中几个重要概念216

10.2数据仓库设计218

10.2.1数据仓库的总体结构218

10.2.2数据仓库的基本功能层219

10.2.3数据仓库技术220

10.2.4数据仓库设计221

10.2.5数据仓库设计步骤221

10.3数据仓库的开发应用222

10.3.1数据仓库概念模型设计与开发223

10.3.2数据仓库的逻辑模型设计226

10.3.3数据仓库物理模型的设计230

10.4数据仓库的技术管理232

10.5 OLAP技术233

10.5.1基本概念233

10.5.2多维分析234

10.5.3维的层次关系235

10.5.4维的类关系235

10.5.5 OLAP与数据仓库的关系235

10.6基于MATLAB的数据仓库开发技术237

10.6.1数据库工具箱237

10.6.2可视查询生成器239

10.6.3数据的存取类型247

10.6.4数据输入和输出252

第11章 模糊集理论257

11.1模糊集合258

11.1.1隶属度函数258

11.1.2模糊集运算260

11.1.3 λ截集260

11.2模糊关系261

11.3模糊聚类262

11.3.1数据标准化263

11.3.2相似系数和距离263

11.3.3模糊聚类分析266

11.3.4模糊K-均值聚类267

11.4基于MATLAB的模糊集处理技术267

第12章 粗糙集技术281

12.1粗糙集理论的基本概念282

12.1.1知识表达系统和决策表282

12.1.2等价关系282

12.1.3等价划分283

12.1.4上近似集和下近似集283

12.1.5粗糙集284

12.1.6粗糙集的非确定性的精确度a A(Y)和粗糙度ρ A(Y)284

12.2分类规则的形成284

12.3知识的约简285

12.3.1决策表的一致性285

12.3.2属性约简285

12.3.3分辨矩阵与分辨函数286

12.4模糊集与粗糙集287

12.5基于MATLAB的粗糙集处理方法287

第13章 目标优化技术291

13.1目标优化概述292

13.2极值问题293

13.3无约束非线性规划293

13.3.1梯度下降法294

13.3.2共轭梯度法295

13.3.3牛顿法295

13.4有约束非线性规划295

13.5大规模优化问题的分解算法296

13.5.1问题的描述296

13.5.2目标协调法297

13.5.3模型协调法298

13.5.4混合协调法298

13.6其他优化方法299

13.7基于MATLAB的目标优化方法300

第14章 可视化技术307

14.1可视化技术概述308

14.2可视化技术分类309

14.2.1数据可视化309

14.2.2科学计算可视化309

14.2.3信息可视化309

14.2.4知识可视化310

14.3多维数据可视化310

14.3.1平行坐标表示法311

14.3.2雷达图312

14.3.3树形图313

14.3.4三角多项式图314

14.3.5散点图315

14.3.6星座图316

14.3.7基于像素的高维数据的可视化318

14.3.8基于非线性变换的图表示优化318

14.3.9高维数据降维319

14.4图形的特征分析321

14.4.1平行坐标下的聚簇分析321

14.4.3图形特征提取中的特征排序问题323

14.5基于多元图的图形分类方法324

14.5.1单原型图形分类器324

14.5.2基于平行坐标的平行筛可视化分类方法325

14.5.3基于平行坐标的贝叶斯可视化分类方法325

14.6基于色度学空间的多元图表示326

14.7基于MATLAB的数据可视化技术327

第15章 公式发现341

15.1公式发现概述342

15.2公式发现系统中的知识342

15.2.1规则一(函数规则)343

15.2.2规则二(导数规则)344

15.2.3多维函数扩展规则345

15.2.4规则三346

15.3基于MATLAB的公式发现347

第16章 多媒体数据挖掘技术349

16.1多媒体数据挖掘技术概述350

16.1.1数据类型350

16.1.2多媒体数据库管理系统(MM-DBMS)351

16.2文本挖掘352

16.2.1基于关键字的关联分析354

16.2.2文档分类分析354

16.3图像挖掘360

16.4视频挖掘361

16.4.1结构挖掘361

16.4.2运动挖掘361

16.4.3趋势挖掘362

16.5音频挖掘362

16.6复合类型数据的挖掘363

第17章 Web数据挖掘技术365

17.1 Web数据挖掘技术概述366

17.2 Web内容挖掘366

17.2.1爬虫367

17.2.2虚拟Web视图367

17.2.3个性化368

17.3 Web结构挖掘369

17.3.1 PageRank369

17.3.2 Clever369

17.4 Web使用挖掘369

17.4.1预处理370

17.4.2数据结构370

17.4.3模式发现370

17.4.4模式发现371

17.4.5基于组织协同进化的Web日志挖掘算法371

第4篇 数据挖掘应用实战377

第18章 数据统计特性377

18.1数据关系发现378

18.2频率和众数378

18.3百分位数(percentile)378

18.4中心度量378

18.5散布程度度量379

18.6数据的分布描述380

18.7数据的概率分布383

第19章 数据预处理385

19.1数据预处理完毕386

19.2数据清理386

19.2.1填补缺失数据386

19.2.2消除噪声数据387

19.2.3实现数据一致性388

19.3数据集成与转换388

19.3.1数据集成388

19.3.2数据转换389

19.4数据归约与压缩390

19.4.1数据归约390

19.4.2数据压缩395

19.4.3数值归约395

19.5数值数据的概念分层与离散化396

19.5.1概念分层396

19.5.2概念分层的类型397

19.5.3数值数据离散化398

19.5.4分类数据的概念分层399

19.6例题399

第20章 分类411

20.1分类概述412

20.2方法412

20.3例题415

第21章 预测421

21.1回归分析422

21.1.1逐步回归422

21.1.2岭回归424

21.1.3主成分回归分析425

21.2时间序列预测模型425

21.2.1时间序列的特征量426

21.2.2平稳时间序列预测模型426

21.3马尔可夫链429

21.4灰色系统方法430

21.4.1灰色系统的基本概念430

21.4.2灰色序列生成算子431

21.4.3灰色分析433

21.5例题438

第22章 聚类459

22.1聚类分析概述460

21.2聚类分析中的数据类型461

22.3相似性度量463

22.3.1属性间的相似性度量464

22.3.2对象间的相似性度量465

22.3.3相异度矩阵465

22.4聚类的特征468

22.5聚类准则469

22.6划分方法470

22.7层次方法471

22.7.1利用层次方法的平衡迭代归约及聚类473

22.7.2利用代表点聚类474

22.8基于密度的方法474

22.9基于网格的方法476

22.10基于模型的聚类方法477

22.11基于目标函数的方法478

22.11.1样本与类之间的距离478

22.11.2类内距离479

22.11.3类与类之间的距离479

22.12离群点检测480

22.12.1基于统计的离群点检测方法481

22.12.2基于距离的离群点检测方法482

22.12.3基于相对密度的离群点检测方法483

22.12.4基于聚类的离群点检测方法484

22.12.5离群点挖掘方法的评估486

22.13聚类有效性487

22.13.1内部质量评价准则487

22.13.2外部质量评价准则489

22.14例题489

第23章 时序数据挖掘505

23.1基本定义506

23.2时序数据挖掘参数507

23.3时序关联规则507

23.3.1事务间关联规则508

23.3.2情节规则508

23.3.3序列关联规则508

23.3.4日历关联规则509

23.4时间序列挖掘509

23.4.1时间序列分析509

23.4.2趋势分析509

23.4.3相似性搜索511

23.4.4周期分析512

23.5时间序列分段线性表示512

23.6时间序列的预测513

23.7例题513

第24章 关联规则挖掘527

24.1关联规则的类型及挖掘算法528

24.2基于组织进化的关联规则挖掘528

24.2.1组织的定义528

24.2.2组织适应度的计算529

24.2.3组织进化算子529

24.2.4算法步骤529

24.3基于组织层次进化的关联规则挖掘530

24.3.1聚合算子530

24.3.2进化种群pe和最优种群pb530

24.3.3算法步骤530

24.4多维关联规则挖掘531

24.4.1染色体的编码531

24.4.2亲和度函数的构造531

24.4.3算法步骤532

24.5关联规则扩展532

24.5.1多层次关联规则532

24.5.2多维度关联规则533

24.5.3定量关联规则533

24.5.4基于约束的关联规则534

24.6例题534

参考文献548

热门推荐