图书介绍

XML挖掘 聚类、分类与信息提取PDF|Epub|txt|kindle电子书版本网盘下载

XML挖掘 聚类、分类与信息提取
  • 潘有能编 著
  • 出版社: 杭州:浙江大学出版社
  • ISBN:9787308102544
  • 出版时间:2012
  • 标注页数:152页
  • 文件大小:10MB
  • 文件页数:162页
  • 主题词:可扩充语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

XML挖掘 聚类、分类与信息提取PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章XML与数据挖掘概述1

1.1 XML1

1.1.1 XML的发展与特点1

1.1.2 XML文档的结构4

1.1.3 DTD和Schema6

1.1.4 Namespace7

1.1.5 CSS、XSL与XPath8

1.1.6 XLink、XPointer和XBase9

1.1.7应用程序接口DOM与SAX10

1.2数据挖掘概述11

1.2.1数据挖掘对象11

1.2.2数据挖掘功能12

1.2.3数据挖掘方法13

第2章XML数据预处理16

2.1 XML文档解析16

2.2 XML文档标记语义消歧19

2.2.1 WordNet简介20

2.2.2基于WordNet的XML文档标记语义消歧22

第3章XML聚类26

3.1 XML聚类概述26

3.1.1基于划分的聚类算法26

3.1.2层次聚类算法28

3.1.3基于遗传算法的聚类算法32

3.1.4聚类质量的评价34

3.2 XML文档相似度计算35

3.2.1传统XMLL文档相似度计算方法36

3.2.2 XML文档标记语义相似度计算41

3.2.3基于语义的XML文档相似度计算47

3.3 XML文档聚类49

3.3.1相似度矩阵50

3.3.2最近邻聚类算法51

3.3.3聚类实验结果与分析52

第4章XML分类54

4.1相关定义54

4.2权重计算56

4.2.1层次权重的计算56

4.2.2结构权重的计算56

4.2.3相关参数的设置59

4.3相似性计算59

4.4 XML文档分类61

第5章XML文档间结构挖掘62

5.1 XML链接62

5.1.1 XML链接和HTML链接的比较62

5.1.2 XML简单链接63

5.1.3 XML扩展链接64

5.2 Web结构挖掘算法65

5.2.1 PageRank算法65

5.2.2 HITS算法66

5.3基于XML链接的文档间结构挖掘68

第6章XML查询与信息提取70

6.1 XML查询语言70

6.1.1 XML查询语言简介70

6.1.2 XQuery的数据模型72

6.1.3 XQuery语言74

6.1.4 XML查询语言的进一步发展78

6.2特征提取79

6.2.1名字特征提取79

6.2.2数字特征的提取与转换79

6.2.3 XML文档中的特征提取80

6.3主题提取80

6.3.1关键词提取80

6.3.2主题概念的提取82

6.3.3主题句的提取82

6.3.4 XML文档的主题提取83

6.4自动摘要83

6.4.1自动摘录83

6.4.2基于理解的自动摘要85

6.4.3信息抽取85

6.4.4基于结构的自动摘要86

6.4.5 XML文档的自动摘要87

第7章 基于XML的数据挖掘建模和知识表示89

7.1基于XML的数据挖掘建模89

7.1.1 PMML概述90

7.1.2 PMML的结构92

7.1.3 PMML在数据挖掘系统中的实际应用96

7.2基于XML的知识表示99

7.2.1元数据99

7.2.2资源描述框架101

7.2.3资源描述框架模式103

7.2.4知识表示方法的XML描述104

第8章 基于XML的Web使用挖掘110

8.1基于XML的Web使用挖掘体系结构110

8.2 XGMML111

8.3 LOGML文档的结构113

8.3.1 LOGML中的日志基本信息113

8.3.2 LOGML中的日志统计信息114

8.3.3 LOGML中的用户会话信息115

8.4 LOGML文档的生成116

8.5基于LOGML的数据挖掘118

8.5.1频繁集发现118

8.5.2 LOGML频繁结构的挖掘120

附录一:基于语义的XML文档相似度计算源程序123

附录二:XML文档聚类算法源程序133

参考文献136

热门推荐