图书介绍

数据挖掘原理与算法PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘原理与算法
  • 毛国君等编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:7302106312
  • 出版时间:2005
  • 标注页数:314页
  • 文件大小:38MB
  • 文件页数:268页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘原理与算法PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

目录1

第1章 绪论1

1.1 数据挖掘技术的产生与发展1

1.1.1 数据挖掘技术的商业需求分析1

1.1.2 数据挖掘产生的技术背景分析3

1.2 数据挖掘研究的发展趋势4

1.3 数据挖掘的概念6

1.3.1 从商业角度看数据挖掘技术7

1.3.2 数据挖掘的技术含义7

1.3.3 数据挖掘研究的理论基础8

1.4 数据挖掘技术的分类问题10

1.5 数据挖掘常用的知识表示模式与方法11

1.5.1 广义知识挖掘11

1.5.2 关联知识挖掘13

1.5.3 类知识挖掘14

1.5.4 预测型知识挖掘19

1.5.5 特异型知识挖掘20

1.6 不同数据存储形式下的数据挖掘问题21

1.6.1 事务数据库中的数据挖掘21

1.6.2 关系型数据库中的数据挖掘21

1.6.3 数据仓库中的数据挖掘23

1.6.4 在关系模型基础上发展的新型数据库中的数据挖掘23

1.6.5 面向应用的新型数据源中的数据挖掘24

1.6.6 Web数据源中的数据挖掘24

1.7 粗糙集方法及其在数据挖掘中的应用26

1.7.1 粗糙集的一些重要概念26

1.7.2 粗糙集应用举例27

1.8.1 数据挖掘与CRM29

1.8 数据挖掘的应用分析29

1.7.3 粗糙集方法在KDD中的应用范围29

1.8.2 数据挖掘应用的成功案例分析30

1.9 本章小结和文献注释32

第2章 知识发现过程与应用结构37

2.1 知识发现的基本过程37

2.1.1 数据抽取与集成38

2.1.2 数据清洗与预处理39

2.1.3 数据的选择与整理39

2.1.4 数据挖掘40

2.1.5 模式评估40

2.2 数据库中的知识发现处理过程模型41

2.2.1 阶梯处理过程模型41

2.2.2 螺旋处理过程模型42

2.2.3 以用户为中心的处理模型43

2.2.4 联机KDD模型45

2.2.5 支持多数据源多知识模式的KDD处理模型46

2.3 知识发现软件或工具的发展49

2.3.1 独立的知识发现软件49

2.3.2 横向的知识发现工具49

2.3.3 纵向的知识发现解决方案50

2.3.4 KDD系统介绍50

2.4 知识发现项目的过程化管理53

2.5 数据挖掘语言介绍54

2.5.1 数据挖掘语言的分类54

2.5.2 数据挖掘查询语言55

2.5.3 数据挖掘建模语言56

2.5.4 通用数据挖掘语言57

2.5.5 DMQL挖掘查询语言介绍59

2.6 本章小结和文献注释62

第3章 关联规则挖掘理论和算法64

3.1 基本概念与解决方法64

3.2 经典的频繁项目集生成算法分析65

3.2.1 项目集格空间理论65

3.2.2 经典的发现频繁项目集算法66

3.2.3 关联规则生成算法68

3.3 Apriori算法的性能瓶颈问题70

3.4 Apriori的改进算法71

3.4.1 基于数据分割(Partition)的方法71

3.4.2 基于散列(Hash)的方法72

3.4.3 基于采样(Sampling)的方法73

3.5 项目集格空间理论的发展74

3.5.1 Close算法74

3.5.2 FP-tree算法79

3.6 项目序列集格空间和它的操作83

3.7 基于项目序列集操作的关联规则挖掘算法85

3.7.1 关联规则挖掘空间85

3.7.2 三个实用算子85

3.7.3 最大频繁项目序列集的生成算法87

3.7.4 ISS-DM算法执行示例87

3.8 改善关联规则挖掘质量问题88

3.8.1 用户主观层面88

3.8.2 系统客观层面89

3.9 约束数据挖掘问题89

3.9.1 约束在数据挖掘中的作用89

3.9.2 约束的类型90

3.10 时态约束关联规则挖掘93

3.11.1 多层次关联规则挖掘96

3.11 关联规则挖掘中的一些更深入的问题96

3.11.2 多维关联规则挖掘97

3.11.3 数量关联规则挖掘98

3.12 数量关联规则挖掘方法99

3.12.1 数量关联规则挖掘问题99

3.12.2 数量关联规则的分类100

3.12.3 数量关联规则挖掘的一般步骤101

3.12.4 数值属性离散化问题及算法103

3.13 本章小结和文献注释106

第4章 分类方法109

4.1 分类的基本概念与步骤109

4.2 基于距离的分类算法111

4.3 决策树分类方法114

4.3.1 决策树基本算法概述115

4.3.2 ID3算法117

4.3.3 C4.5算法123

4.4 贝叶斯分类127

4.4.1 贝叶斯定理127

4.4.2 朴素贝叶斯分类128

4.4.3 EM算法130

4.5 规则归纳134

4.5.1 AQ算法135

4.5.2 CN2算法138

4.5.3 FOIL算法146

4.6 与分类有关的其他问题150

4.6.1 分类数据预处理150

4.6.2 分类器性能的表示与评估151

4.7 本章小结和文献注释153

第5章 聚类方法156

5.1 概述156

5.1.1 聚类分析在数据挖掘中的应用157

5.1.2 聚类分析算法的概念与基本分类158

5.1.3 距离与相似性的度量160

5.2 划分聚类方法163

5.2.1 k-平均算法164

5.2.2 PAM166

5.2.3 其他方法170

5.3 层次聚类方法170

5.3.1 AGNES算法171

5.3.2 DIANA算法172

5.3.3 其他聚类方法174

5.4 密度聚类方法175

5.5 其他聚类方法178

5.5.1 STING算法179

5.5.3 COBWEB算法180

5.5.2 SOM算法180

5.5.4 模糊聚类算法FCM181

5.6 本章小结和文献注释181

第6章 时间序列和序列模式挖掘183

6.1 时间序列及其应用183

6.2 时间序列预测的常用方法184

6.2.1 确定性时间序列预测方法184

6.2.2 随机时间序列预测方法185

6.2.3 其他方法185

6.3 基于ARMA模型的序列匹配方法185

6.3.1 基本概念185

6.3.2 利用基本概念建立模型186

6.3.3 构造判别函数187

6.4 基于离散富里叶变换的时间序列相似性查找188

6.4.1 完全匹配189

6.4.2 子序列匹配190

6.5 基于规范变换的查找方法192

6.5.1 基本概念193

6.5.2 查找方法193

6.6 序列挖掘195

6.6.1 基本概念196

6.6.2 数据源的形式196

6.6.3 序列模式挖掘的一般步骤198

6.7 AprioriAll算法199

6.8 AprioriSome算法202

6.9 GSP算法205

6.10 本章小结和文献注释207

第7章 Web挖掘技术211

7.1 Web挖掘的意义211

7.2 Web挖掘的分类212

7.3 Web挖掘的含义213

7.3.1 Web挖掘与信息检索214

7.3.2 Web挖掘与信息抽取214

7.4 Web挖掘的数据来源215

7.4.1 服务器日志数据215

7.4.2 在线市场数据216

7.4.3 Web页面216

7.4.4 Web页面超链接关系216

7.4.5 其他信息217

7.5 Web内容挖掘方法217

7.5.1 爬虫与Web内容挖掘218

7.5.2 虚拟的Web视图218

7.5.3 个性化与Web内容挖掘219

7.5.4 对Web页面内文本信息的挖掘219

7.5.6 Web页面内容的预处理220

7.5.5 对Web页面内多媒体信息挖掘220

7.6 Web访问信息挖掘方法221

7.6.1 Web访问信息挖掘的特点和意义221

7.6.2 Web访问信息挖掘的意义223

7.6.3 Web访问信息挖掘的数据源224

7.6.4 Web访问信息挖掘的预处理227

7.6.5 其他信息的预处理技术231

7.6.6 在Web访问挖掘中的常用技术233

7.6.7 Web访问信息挖掘的要素构成234

7.6.8 利用Web访问信息挖掘实现用户建模235

7.6.9 利用Web访问信息挖掘发现导航模式237

7.6.10 利用Web访问信息挖掘改进访问效率239

7.6.11 利用Web访问信息挖掘进行个性化服务240

7.6.12 利用Web访问信息挖掘进行商业智能发现242

7.6.13 利用Web访问信息挖掘进行用户移动模式发现243

7.6.14 利用协作推荐的方法实现实时个性化推荐的例子244

7.7 Web结构挖掘方法247

7.7.1 页面重要性的评价方法247

7.7.2 页面等级248

7.7.3 权威页面和中心页面248

7.7.4 Web站点结构的预处理249

7.8 本章小结和文献注释251

第8章 空间挖掘256

8.1 引言256

8.2 空间数据概要257

8.2.1 空间数据的复杂性特征257

8.2.2 空间查询问题258

8.2.3 空间数据结构259

8.2.4 专题地图263

8.3 空间数据挖掘基础264

8.4 空间统计学265

8.5 泛化与特化266

8.5.1 逐步求精266

8.5.2 泛化267

8.5.3 最临近268

8.5.4 统计信息网格方法STING268

8.6 空间规则270

8.7 空间分类算法272

8.7.1 ID3扩展273

8.7.2 空间决策树273

8.8 空间聚类算法274

8.8.1 基于随机搜索的聚类方法CLARANS扩展274

8.8.2 大型空间数据库基于距离分布的聚类算法DBCLASD275

8.8.3 BANG276

8.8.4 小波聚类277

8.8.5 近似值277

8.9 空间挖掘的其他问题278

8.10 空间数据挖掘原型系统介绍281

8.11 空间数据挖掘的研究现状283

8.12 空间数据挖掘的研究与发展方向284

8.13 空间数据挖掘与相关学科的关系286

8.13.1 空间数据挖掘与空间数据库286

8.13.2 空间数据挖掘与空间数据仓库287

8.13.3 空间数据挖掘与空间联机分析处理287

8.13.4 空间数据挖掘与地理信息系统288

8.14 数字地球289

8.15 本章小结和文献注释289

参考文献292

热门推荐