图书介绍

数据挖掘理论与应用PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘理论与应用
  • 胡可云,田凤占,黄厚宽编著 著
  • 出版社: 北京:北京交通大学出版社
  • ISBN:7811232529
  • 出版时间:2008
  • 标注页数:248页
  • 文件大小:68MB
  • 文件页数:258页
  • 主题词:数据库-理论

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘理论与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 导论1

数据挖掘概述1

数据挖掘的背景1

数据挖掘的定义2

数据挖掘的应用4

数据挖掘的一般过程6

数据挖掘中的数据集6

数据挖掘的任务8

数据挖掘过程10

数据挖掘的一般方法12

分类预测型方法12

描述型方法14

文本/Web挖掘方法16

第2章 分类方法18

决策树18

决策树基本概念18

决策树构造过程20

决策树的扩展23

前馈神经网络24

基本概念24

BP训练过程25

RBF网络28

基于规则的方法30

AQ算法31

C45 rules32

RIPPER33

支持向量机34

核函数34

线性可分模式下的最优超平面35

线性不可分模式下的最优超平面36

支持向量机36

贝叶斯分类38

贝叶斯理论和极大后验假设39

贝叶斯网络和贝叶斯分类器39

几种常见的贝叶斯分类器模型40

贝叶斯分类器应用举例44

粗糙集方法47

粗糙集概念47

粗糙集基本算法54

粗糙集方法的扩展61

其他分类方法64

回归分析64

k-最近邻分类方法67

组合学习方法68

第3章 聚类方法71

聚类方法概述71

聚类分析中的常见数据类型72

对聚类算法的一些典型要求74

主要的聚类方法75

划分聚类76

k-均值算法76

二分k-均值聚类方法78

k-中心点算法78

层次聚类79

凝聚的和分裂的层次聚类79

BIRCH算法81

CURE算法83

ROCK算法84

Chameleon85

基于密度的聚类86

DBSCAN算法86

OPTICS算法88

Kohonen聚类90

自组织神经网络90

Kohonen自组织映射90

孤立点分析92

基于统计的孤立点检测92

基于距离的孤立点检测93

基于偏离的孤立点检测方法94

概念格95

基本概念95

概念格的建造97

规则提取102

第4章 关联分析103

基本概念与挖掘过程103

基本概念103

关联规则挖掘过程105

频繁项集挖掘算法106

Apriori算法106

Apriori算法的改进109

FP- Growth算法110

关联规则生成算法114

频繁闭项集挖掘115

关联规则的扩展115

多层次关联规则115

多维关联规则116

定量关联规则116

加权关联规则117

序列模式分析117

第5章 文本与Web挖掘120

文本挖掘120

文本预处理120

文本检索127

文本分类135

文本聚类139

文本摘要140

Web挖掘144

概述144

Web内容挖掘146

Web结构挖掘149

Web使用挖掘152

第6章 业务理解160

需求分析160

需求分析的内容160

需求分析的方法161

需求分析的结果161

需求分析的注意事项162

实例:客户细分项目的需求分析162

客户细分项目的内容162

分析方法164

分析结果164

第7章 数据预处理165

数据理解165

数据准备166

数据整理与合并166

数据抽样167

训练集和测试集的划分方法170

类标签的确定172

数据描述173

单变量描述方法174

多变量描述方法178

数据清理183

缺值处理183

探测异常点与噪声清除185

变量变换与合成188

连续变量归一化188

离散变量的数值化190

连续变量离散化191

变量变换195

变量合成197

变量选择201

概述201

包装方法202

过滤方法203

主成分及因子分析205

一些算法对预处理的要求207

实例:客户流失项目的数据预处理207

数据理解和数据准备208

数据描述和清理210

数据变换与选择210

第8章 建模213

算法选择213

模型参数调整214

模型评估和性能比较215

分类模型的评估方法215

聚类模型的评估方法217

模型导出218

实例 客户流失项目的建模223

算法选择223

参数调整223

性能评估223

模型导出224

第9章 模型部署与维护225

模型部署225

模型维护225

客户流失项目的模型部署与维护226

附录A 主要数据挖掘软件简介227

SAS Enterprise Miner227

概述227

数据挖掘过程及模块228

SPSS Clementine231

概述231

数据挖掘过程及模块231

IBM Intelligent Miner235

概述235

数据挖掘过程及模块236

其他常见数据挖掘工具238

参考文献240

热门推荐