图书介绍

跟着迪哥学Python数据分析与机器学习实战PDF|Epub|txt|kindle电子书版本网盘下载

跟着迪哥学Python数据分析与机器学习实战
  • 唐宇迪著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115512444
  • 出版时间:2019
  • 标注页数:449页
  • 文件大小:217MB
  • 文件页数:461页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

跟着迪哥学Python数据分析与机器学习实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 人工智能入门指南1

1.1 AI时代首选Python2

1.1.1 Python的特点2

1.1.2 Python该怎么学2

1.2 人工智能的核心——机器学习3

1.2.1 什么是机器学习3

1.2.2 机器学习的流程4

1.2.3 机器学习该怎么学5

1.3 环境配置5

1.3.1 Anaconda大礼包6

1.3.2 Jupyter Notebook9

1.3.3 上哪儿找资源11

本章总结12

第2章 科学计算库(Numpy)13

2.1 Numpy的基本操作14

2.1.1 array数组14

2.1.2 数组特性15

2.1.3 数组属性操作16

2.2 索引与切片17

2.2.1 数值索引17

2.2.2 bool索引18

2.3 数据类型与数值计算20

2.3.1 数据类型20

2.3.2 复制与赋值20

2.3.3 数值运算21

2.3.4 矩阵乘法24

2.4 常用功能模块25

2.4.1 排序操作25

2.4.2 数组形状操作26

2.4.3 数组的拼接28

2.4.4 创建数组函数29

2.4.5 随机模块31

2.4.6 文件读写33

本章总结37

第3章 数据分析处理库(Pandas)38

3.1 数据预处理,39

3.1.1 数据读取39

3.1.2 DataFrame结构40

3.1.3 数据索引42

3.1.4 创建DataFrame46

3.1.5 Series操作48

3.2 数据分析51

3.2.1 统计分析51

3.2.2 pivot数据透视表55

3.2.3 groupby操作58

3.3 常用函数操作63

3.3.1 Merge操作63

3.3.2 排序操作66

3.3.3 缺失值处理67

3.3.4 apply自定义函数70

3.3.5 时间操作73

3.3.6 绘图操作76

3.4 大数据处理技巧79

3.4.1 数值类型转换79

3.4.2 属性类型转换82

本章总结84

第4章 数据可视化库(Matplotlib)85

4.1 常规绘图方法86

4.1.1 细节设置86

4.1.2 子图与标注90

4.1.3 风格设置97

4.2 常用图表绘制99

4.2.1 条形图99

4.2.2 盒图102

4.2.3 直方图与散点图105

4.2.4 3D图107

4.2.5 布局设置110

本章总结111

第5章 回归算法112

5.1 线性回归算法113

5.1.1 线性回归方程113

5.1.2 误差项分析114

5.1.3 似然函数求解115

5.1.4 线性回归求解117

5.2 梯度下降算法117

5.2.1 下山方向选择118

5.2.2 梯度下降优化119

5.2.3 梯度下降策略对比120

5.2.4 学习率对结果的影响121

5.3 逻辑回归算法122

5.3.1 原理推导122

5.3.2 逻辑回归求解124

本章总结125

第6章 逻辑回归项目实战——信用卡欺诈检测126

6.1 数据分析与预处理127

6.1.1 数据读取与分析127

6.1.2 样本不均衡解决方案129

6.1.3 特征标准化129

6.2 下采样方案133

6.2.1 交叉验证134

6.2.2 模型评估方法137

6.2.3 正则化惩罚139

6.3 逻辑回归模型141

6.3.1 参数对结果的影响141

6.3.2 混淆矩阵144

6.3.3 分类阈值对结果的影响147

6.4 过采样方案149

6.4.1 SMOTE数据生成策略150

6.4.2 过采样应用效果151

项目总结152

第7章 决策树154

7.1 决策树原理155

7.1.1 决策树的基本概念155

7.1.2 衡量标准156

7.1.3 信息增益158

7.1.4 决策树构造实例159

7.1.5 连续值问题161

7.1.6 信息增益率161

7.1.7 回归问题求解162

7.2 决策树剪枝策略162

7.2.1 剪枝策略162

7.2.2 决策树算法涉及参数163

本章总结164

第8章 集成算法165

8.1 bagging算法166

8.1.1 并行的集成166

8.1.2 随机森林166

8.2 boosting算法170

8.2.1 串行的集成170

8.2.2 Adaboost算法171

8.3 stacking模型173

本章总结174

第9章 随机森林项目实战——气温预测175

9.1 随机森林建模176

9.1.1 特征可视化与预处理177

9.1.2 随机森林回归模型183

9.1.3 树模型可视化方法184

9.1.4 特征重要性189

9.2 数据与特征对结果影响分析192

9.2.1 特征工程194

9.2.2 数据量对结果影响分析196

9.2.3 特征数量对结果影响分析199

9.3 模型调参206

9.3.1 随机参数选择208

9.3.2 网络参数搜索212

项目总结216

第10章 特征工程217

10.1 数值特征218

10.1.1 字符串编码218

10.1.2 二值与多项式特征222

10.1.3 连续值离散化225

10.1.4 对数与时间变换228

10.2 文本特征230

10.2.1 词袋模型230

10.2.2 常用文本特征构造方法234

10.3 论文与benchmark237

本章总结240

第11章 贝叶斯算法项目实战——新闻分类241

11.1 贝叶斯算法242

11.1.1 贝叶斯公式242

11.1.2 拼写纠错实例244

11.1.3 垃圾邮件分类246

11.2 新闻分类任务248

11.2.1 数据清洗249

11.2.2 TF-IDF关键词提取253

项目总结259

第12章 支持向量机260

12.1 支持向量机工作原理261

12.1.1 支持向量机要解决的问题261

12.1.2 距离与标签定义262

12.1.3 目标函数263

12.1.4 拉格朗日乘子法264

12.2 支持向量的作用266

12.2.1 支持向量机求解266

12.2.2 支持向量的作用267

12.3 支持向量机涉及参数268

12.3.1 软间隔参数的选择268

12.3.2 核函数的作用270

12.4 案例:参数对结果的影响272

12.4.1 SVM基本模型272

12.4.2 核函数变换277

12.4.3 SVM参数选择279

12.4.4 SVM人脸识别实例281

本章总结284

第13章 推荐系统285

13.1 推荐系统的应用286

13.2 协同过滤算法288

13.2.1 基于用户的协同过滤288

13.2.2 基于商品的协同过滤291

13.3 隐语义模型292

13.3.1 矩阵分解思想292

13.3.2 隐语义模型求解294

13.3.3 评估方法296

本章总结296

第14章 推荐系统项目实战——打造音乐推荐系统297

14.1 数据集清洗298

14.1.1 统计分析299

14.1.2 数据集整合303

14.2 基于相似度的推荐308

14.2.1 排行榜推荐309

14.2.2 基于歌曲相似度的推荐310

14.3 基于矩阵分解的推荐313

14.3.1 奇异值分解313

14.3.2 使用SVD算法进行音乐推荐317

项目总结322

第15章 降维算法323

15.1 线性判别分析324

15.1.1 降维原理概述324

15.1.2 优化的目标325

15.1.3 线性判别分析求解326

15.1.4 Python实现线性判别分析降维328

15.2 主成分分析335

15.2.1 PCA降维基本知识点335

15.2.2 PCA优化目标求解336

15.2.3 Python实现PCA降维338

本章总结345

第16章 聚类算法346

16.1 K-means算法347

16.1.1 聚类的基本特性347

16.1.2 K-means算法原理348

16.1.3 K-means涉及参数350

16.1.4 K-means聚类效果与优缺点352

16.2 DBSCAN聚类算法353

16.2.1 DBSCAN算法概述353

16.2.2 DBSCAN工作流程354

16.2.3 半径对结果的影响357

16.3 聚类实例358

本章总结363

第17章 神经网络364

17.1 神经网络必备基础365

17.1.1 神经网络概述365

17.1.2 计算机眼中的图像367

17.1.3 得分函数368

17.1.4 损失函数370

17.1.5 反向传播372

17.2 神经网络整体架构374

17.2.1 整体框架374

17.2.2 神经元的作用376

17.2.3 正则化378

17.2.4 激活函数379

17.3 网络调优细节381

17.3.1 数据预处理381

17.3.2 Drop-Out382

17.3.3 数据增强383

17.3.4 网络结构设计384

本章总结384

第18章 TensorFlow实战386

18.1 TensorFlow基本操作387

18.1.1 TensorFlow特性387

18.1.2 TensorFlow基本操作389

18.1.3 TensorFlow实现回归任务392

18.2 搭建神经网络进行手写字体识别395

本章总结402

第19章 卷积神经网络403

19.1 卷积操作原理404

19.1.1 卷积神经网络应用404

19.1.2 卷积操作流程406

19.1.3 卷积计算方法408

19.1.4 卷积涉及参数411

19.1.5 池化层415

19.2 经典网络架构416

19.2.1 卷积神经网络整体架构416

19.2.2 AlexNet网络417

19.2.3 VGG网络418

19.2.4 ResNet网络421

19.3 TensorFlow实战卷积神经网络424

本章总结427

第20章 神经网络项目实战——影评情感分析428

20.1 递归神经网络429

20.1.1 RNN网络架构429

20.1.2 LSTM网络430

20.2 影评数据特征工程431

20.2.1 词向量432

20.2.2 数据特征制作436

20.3 构建RNN模型444

项目总结449

热门推荐