图书介绍

机器学习 Python实践PDF|Epub|txt|kindle电子书版本网盘下载

机器学习 Python实践
  • 魏贞原著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121331107
  • 出版时间:2018
  • 标注页数:211页
  • 文件大小:18MB
  • 文件页数:230页
  • 主题词:机器学习;软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

机器学习 Python实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 初始2

1 初识机器学习2

1.1学习机器学习的误区2

1.2什么是机器学习3

1.3 Python中的机器学习3

1.4学习机器学习的原则5

1.5学习机器学习的技巧5

1.6这本书不涵盖以下内容6

1.7代码说明6

1.8总结6

2 Python机器学习的生态圈7

2.1 Python7

2.2 SciPy9

2.3 scikit-learn9

2.4环境安装10

2.4.1安装Python10

2.4.2安装SciPy10

2.4.3安装scikit-learn11

2.4.4更加便捷的安装方式11

2.5总结12

3 第一个机器学习项目13

3.1机器学习中的Hello World项目13

3.2导入数据14

3.2.1导入类库14

3.2.2导入数据集15

3.3概述数据15

3.3.1数据维度16

3.3.2查看数据自身16

3.3.3统计描述数据17

3.3.4数据分类分布17

3.4数据可视化18

3.4.1单变量图表18

3.4.2多变量图表20

3.5评估算法20

3.5.1分离出评估数据集21

3.5.2评估模式21

3.5.3创建模型21

3.5.4选择最优模型22

3.6实施预测23

3.7总结24

4 Python和SciPy速成25

4.1 Python速成25

4.1.1基本数据类型和赋值运算26

4.1.2控制语句28

4.1.3复杂数据类型29

4.1.4函数32

4.1.5 with语句33

4.2 NumPy速成34

4.2.1创建数组34

4.2.2访问数据35

4.2.3算数运算35

4.3 Matplotlib速成36

4.3.1绘制线条图36

4.3.2散点图37

4.4 Pandas速成39

4.4.1 Series39

4.4.2 DataFrame40

4.5总结41

第二部分 数据理解44

5 数据导入44

5.1 CSV文件44

5.1.1文件头45

5.1.2文件中的注释45

5.1.3分隔符45

5.1.4引号45

5.2 Pima Indians数据集45

5.3采用标准Python类库导入数据46

5.4采用NumPy导入数据46

5.5采用Pandas导入数据47

5.6总结47

6 数据理解48

6.1简单地查看数据48

6.2数据的维度49

6.3数据属性和类型50

6.4描述性统计50

6.5数据分组分布(适用于分类算法)51

6.6数据属性的相关性52

6.7数据的分布分析53

6.8总结54

7 数据可视化55

7.1单一图表55

7.1.1直方图55

7.1.2密度图56

7.1.3箱线图57

7.2多重图表58

7.2.1相关矩阵图58

7.2.2散点矩阵图60

7.3总结61

第三部分 数据准备64

8 数据预处理64

8.1为什么需要数据预处理64

8.2格式化数据65

8.3调整数据尺度65

8.4正态化数据67

8.5标准化数据68

8.6二值数据69

8.7总结70

9.数据特征选定71

9.1特征选定72

9.2单变量特征选定72

9.3递归特征消除73

9.4主要成分分析75

9.5特征重要性76

9.6总结76

第四部分 选择模型78

10.评估算法78

10.1评估算法的方法78

10.2分离训练数据集和评估数据集79

10.3 K折交叉验证分离80

10.4弃一交叉验证分离81

10.5重复随机分离评估数据集与训练数据集82

10.6总结83

11.算法评估矩阵85

11.1算法评估矩阵85

11.2分类算法矩阵86

11.2.1分类准确度86

11.2.2对数损失函数87

11.2.3 AUC图88

11.2.4混淆矩阵90

11.2.5分类报告91

11.3回归算法矩阵93

11.3.1平均绝对误差93

11.3.2均方误差94

11.3.3决定系数(R2)95

11.4总结96

12.审查分类算法97

12.1算法审查97

12.2算法概述98

12.3线性算法98

12.3.1逻辑回归99

12.3.2线性判别分析100

12.4非线性算法101

12.4.1 K近邻算法101

12.4.2贝叶斯分类器102

12.4.3分类与回归树103

12.4.4支持向量机104

12.5总结105

13.审查回归算法106

13.1算法概述106

13.2线性算法107

13.2.1线性回归算法107

13.2.2岭回归算法108

13.2.3套索回归算法109

13.2.4弹性网络回归算法110

13.3非线性算法111

13.3.1 K近邻算法111

13.3.2分类与回归树112

13.3.3支持向量机112

13.4总结113

14 算法比较115

14.1选择最佳的机器学习算法115

14.2机器学习算法的比较116

14.3总结118

15 自动流程119

15.1机器学习的自动流程119

15.2数据准备和生成模型的Pipeline120

15.3特征选择和生成模型的Pipeline121

15.4总结122

第五部分 优化模型124

16 集成算法124

16.1集成的方法124

16.2装袋算法125

16.2.1装袋决策树125

16.2.2随机森林126

16.2.3极端随机树127

16.3提升算法129

16.3.1 AdaBoost129

16.3.2随机梯度提升130

16.4投票算法131

16.5总结132

17 算法调参133

17.1机器学习算法调参133

17.2网格搜索优化参数134

17.3随机搜索优化参数135

17.4总结136

第六部分 结果部署138

18 持久化加载模型138

18.1通过pickle序列化和反序列化机器学习的模型138

18.2通过joblib序列化和反序列化机器学习的模型140

18.3生成模型的技巧141

18.4总结141

第七部分 项目实践144

19 预测模型项目模板144

19.1在项目中实践机器学习145

19.2机器学习项目的Python模板145

19.3各步骤的详细说明146

步骤1:定义问题147

步骤2:理解数据147

步骤3:数据准备147

步骤4:评估算法147

步骤5:优化模型148

步骤6:结果部署148

19.4使用模板的小技巧148

19.5总结149

20 回归项目实例150

20.1定义问题150

20.2导入数据151

20.3理解数据152

20.4数据可视化155

20.4.1单一特征图表155

20.4.2多重数据图表157

20.4.3思路总结159

20.5分离评估数据集159

20.6评估算法160

20.6.1评估算法——原始数据160

20.6.2评估算法——正态化数据162

20.7调参改善算法164

20.8集成算法165

20.9集成算法调参167

20.10确定最终模型168

20.11总结169

21 二分类实例170

21.1问题定义170

21.2导入数据171

21.3分析数据172

21.3.1描述性统计172

21.3.2数据可视化177

21.4分离评估数据集180

21.5评估算法180

21.6算法调参184

21.6.1 K近邻算法调参184

21.6.2支持向量机调参185

21.7集成算法187

21.8确定最终模型190

21.9总结190

22 文本分类实例192

22.1问题定义192

22.2导入数据193

22.3文本特征提取195

22.4评估算法196

22.5算法调参198

22.5.1逻辑回归调参199

22.5.2朴素贝叶斯分类器调参199

22.6集成算法200

22.7集成算法调参201

22.8确定最终模型202

22.9总结203

附录A205

A.1 IDE PyCharm介绍205

A.2 Python文档206

A.3 SciPy、NumPy、Matplotlib和Pandas文档206

A.4树模型可视化206

A.5 scikit-learn的算法选择路径209

A.6聚类分析209

热门推荐