图书介绍
机器学习 Python实践PDF|Epub|txt|kindle电子书版本网盘下载
- 魏贞原著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121331107
- 出版时间:2018
- 标注页数:211页
- 文件大小:18MB
- 文件页数:230页
- 主题词:机器学习;软件工具-程序设计
PDF下载
下载说明
机器学习 Python实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一部分 初始2
1 初识机器学习2
1.1学习机器学习的误区2
1.2什么是机器学习3
1.3 Python中的机器学习3
1.4学习机器学习的原则5
1.5学习机器学习的技巧5
1.6这本书不涵盖以下内容6
1.7代码说明6
1.8总结6
2 Python机器学习的生态圈7
2.1 Python7
2.2 SciPy9
2.3 scikit-learn9
2.4环境安装10
2.4.1安装Python10
2.4.2安装SciPy10
2.4.3安装scikit-learn11
2.4.4更加便捷的安装方式11
2.5总结12
3 第一个机器学习项目13
3.1机器学习中的Hello World项目13
3.2导入数据14
3.2.1导入类库14
3.2.2导入数据集15
3.3概述数据15
3.3.1数据维度16
3.3.2查看数据自身16
3.3.3统计描述数据17
3.3.4数据分类分布17
3.4数据可视化18
3.4.1单变量图表18
3.4.2多变量图表20
3.5评估算法20
3.5.1分离出评估数据集21
3.5.2评估模式21
3.5.3创建模型21
3.5.4选择最优模型22
3.6实施预测23
3.7总结24
4 Python和SciPy速成25
4.1 Python速成25
4.1.1基本数据类型和赋值运算26
4.1.2控制语句28
4.1.3复杂数据类型29
4.1.4函数32
4.1.5 with语句33
4.2 NumPy速成34
4.2.1创建数组34
4.2.2访问数据35
4.2.3算数运算35
4.3 Matplotlib速成36
4.3.1绘制线条图36
4.3.2散点图37
4.4 Pandas速成39
4.4.1 Series39
4.4.2 DataFrame40
4.5总结41
第二部分 数据理解44
5 数据导入44
5.1 CSV文件44
5.1.1文件头45
5.1.2文件中的注释45
5.1.3分隔符45
5.1.4引号45
5.2 Pima Indians数据集45
5.3采用标准Python类库导入数据46
5.4采用NumPy导入数据46
5.5采用Pandas导入数据47
5.6总结47
6 数据理解48
6.1简单地查看数据48
6.2数据的维度49
6.3数据属性和类型50
6.4描述性统计50
6.5数据分组分布(适用于分类算法)51
6.6数据属性的相关性52
6.7数据的分布分析53
6.8总结54
7 数据可视化55
7.1单一图表55
7.1.1直方图55
7.1.2密度图56
7.1.3箱线图57
7.2多重图表58
7.2.1相关矩阵图58
7.2.2散点矩阵图60
7.3总结61
第三部分 数据准备64
8 数据预处理64
8.1为什么需要数据预处理64
8.2格式化数据65
8.3调整数据尺度65
8.4正态化数据67
8.5标准化数据68
8.6二值数据69
8.7总结70
9.数据特征选定71
9.1特征选定72
9.2单变量特征选定72
9.3递归特征消除73
9.4主要成分分析75
9.5特征重要性76
9.6总结76
第四部分 选择模型78
10.评估算法78
10.1评估算法的方法78
10.2分离训练数据集和评估数据集79
10.3 K折交叉验证分离80
10.4弃一交叉验证分离81
10.5重复随机分离评估数据集与训练数据集82
10.6总结83
11.算法评估矩阵85
11.1算法评估矩阵85
11.2分类算法矩阵86
11.2.1分类准确度86
11.2.2对数损失函数87
11.2.3 AUC图88
11.2.4混淆矩阵90
11.2.5分类报告91
11.3回归算法矩阵93
11.3.1平均绝对误差93
11.3.2均方误差94
11.3.3决定系数(R2)95
11.4总结96
12.审查分类算法97
12.1算法审查97
12.2算法概述98
12.3线性算法98
12.3.1逻辑回归99
12.3.2线性判别分析100
12.4非线性算法101
12.4.1 K近邻算法101
12.4.2贝叶斯分类器102
12.4.3分类与回归树103
12.4.4支持向量机104
12.5总结105
13.审查回归算法106
13.1算法概述106
13.2线性算法107
13.2.1线性回归算法107
13.2.2岭回归算法108
13.2.3套索回归算法109
13.2.4弹性网络回归算法110
13.3非线性算法111
13.3.1 K近邻算法111
13.3.2分类与回归树112
13.3.3支持向量机112
13.4总结113
14 算法比较115
14.1选择最佳的机器学习算法115
14.2机器学习算法的比较116
14.3总结118
15 自动流程119
15.1机器学习的自动流程119
15.2数据准备和生成模型的Pipeline120
15.3特征选择和生成模型的Pipeline121
15.4总结122
第五部分 优化模型124
16 集成算法124
16.1集成的方法124
16.2装袋算法125
16.2.1装袋决策树125
16.2.2随机森林126
16.2.3极端随机树127
16.3提升算法129
16.3.1 AdaBoost129
16.3.2随机梯度提升130
16.4投票算法131
16.5总结132
17 算法调参133
17.1机器学习算法调参133
17.2网格搜索优化参数134
17.3随机搜索优化参数135
17.4总结136
第六部分 结果部署138
18 持久化加载模型138
18.1通过pickle序列化和反序列化机器学习的模型138
18.2通过joblib序列化和反序列化机器学习的模型140
18.3生成模型的技巧141
18.4总结141
第七部分 项目实践144
19 预测模型项目模板144
19.1在项目中实践机器学习145
19.2机器学习项目的Python模板145
19.3各步骤的详细说明146
步骤1:定义问题147
步骤2:理解数据147
步骤3:数据准备147
步骤4:评估算法147
步骤5:优化模型148
步骤6:结果部署148
19.4使用模板的小技巧148
19.5总结149
20 回归项目实例150
20.1定义问题150
20.2导入数据151
20.3理解数据152
20.4数据可视化155
20.4.1单一特征图表155
20.4.2多重数据图表157
20.4.3思路总结159
20.5分离评估数据集159
20.6评估算法160
20.6.1评估算法——原始数据160
20.6.2评估算法——正态化数据162
20.7调参改善算法164
20.8集成算法165
20.9集成算法调参167
20.10确定最终模型168
20.11总结169
21 二分类实例170
21.1问题定义170
21.2导入数据171
21.3分析数据172
21.3.1描述性统计172
21.3.2数据可视化177
21.4分离评估数据集180
21.5评估算法180
21.6算法调参184
21.6.1 K近邻算法调参184
21.6.2支持向量机调参185
21.7集成算法187
21.8确定最终模型190
21.9总结190
22 文本分类实例192
22.1问题定义192
22.2导入数据193
22.3文本特征提取195
22.4评估算法196
22.5算法调参198
22.5.1逻辑回归调参199
22.5.2朴素贝叶斯分类器调参199
22.6集成算法200
22.7集成算法调参201
22.8确定最终模型202
22.9总结203
附录A205
A.1 IDE PyCharm介绍205
A.2 Python文档206
A.3 SciPy、NumPy、Matplotlib和Pandas文档206
A.4树模型可视化206
A.5 scikit-learn的算法选择路径209
A.6聚类分析209