图书介绍

Python编程 从数据分析到数据科学PDF|Epub|txt|kindle电子书版本网盘下载

Python编程 从数据分析到数据科学
  • 朝乐门著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121344404
  • 出版时间:2019
  • 标注页数:504页
  • 文件大小:40MB
  • 文件页数:519页
  • 主题词:软件工具-程序设计-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python编程 从数据分析到数据科学PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一篇 准备工作3

1为什么要学习Python?学习Python的什么3

2学习Python之前需要准备的工作有哪些6

3如何看和运行本书代码8

3.1输入部分8

3.2输出部分10

3.3错误与异常信息11

3.4外部数据文件12

3.5注意事项14

第二篇 Python基础19

4数据类型19

4.1查看数据类型的方法20

4.2判断数据类型的方法21

4.3转换数据类型的方法22

4.4特殊数据类型23

4.5序列类型26

5变量28

5.1变量的定义方法29

5.2 Python是动态类型语言29

5.3 Python是强类型语言30

5.4 Python中的变量名是引用31

5.5 Python中区分大小写32

5.6变量命名规范32

5.7 iPython的特殊变量33

5.8查看Python关键字的方法34

5.9查看已定义的所有变量35

5.10删除变量37

6语句书写规范39

6.1一行一句40

6.2一行多句40

6.3一句多行41

6.4复合语句42

6.5空语句43

7赋值语句44

7.1赋值语句在Python中的重要地位45

7.2链式赋值语句45

7.3复合赋值语句46

7.4序列的拆包式赋值46

7.5两个变量值的调换47

8注释语句48

8.1注释方法48

8.2注意事项49

9运算符50

9.1特殊运算符53

9.2内置函数57

9.3 math模块58

9.4优先级与结合方向59

10 if语句61

10.1基本语法61

10.2 elif语句62

10.3 if与三元运算63

10.4注意事项64

11 for语句67

11.1基本语法67

11.2 range()函数67

11.3注意事项68

12 while语句71

12.1基本语法71

122注意事项72

13 pass语句74

13.1含义74

13.2作用75

14列表76

14.1定义方法78

14.2切片操作79

14.3反向遍历81

14.4类型转换83

14.5 extend与append的区别83

14.6列表推导式84

14.7插入与删除87

14.8常用操作函数89

15元组94

15.1定义方法95

15.2主要特征97

15.3基本用法99

15.4应用场景100

16字符串103

16.1定义方法104

16.2主要特征105

16.3字符串的操作106

17序列111

17.1支持索引112

17.2支持切片113

17.3支持迭代114

17.4支持拆包114

17.5支持*运算115

17.6通用函数117

18集合120

18.1定义方法121

18.2主要特征122

18.3基本运算123

18.4应用场景125

19字典126

19.1定义方法127

19.2字典的主要特征128

19.3字典的应用场景129

20迭代器与生成器130

20.1可迭代对象与迭代器131

20.2生成器与迭代器132

21函数134

21.1内置函数135

21.2模块函数135

21.3用户自定义函数136

22内置函数137

22.1内置函数的主要特点138

22.2数学函数138

22.3类型函数139

22.4其他功能函数140

23模块函数145

23.1 import模块名146

23.2 import模块名as别名147

23.3 from模块名import函数名147

24自定义函数149

24.1定义方法151

24.2函数中的docString152

24.3调用方法152

24.4返回值153

24.5自定义函数的形参与实参154

24.6变量的可见性156

24.7值传递与地址传递158

24.8自定义函数时的注意事项160

25 lambda函数162

25.1 lambda函数的定义方法163

25.2 lambda函数的调用方法164

26模块166

26.1导入与调用用法167

26.2查看内置模块清单的方法168

27包171

27.1相关术语172

27.2安装包172

27.3查看已安装包173

27.4更新(或删除)已安装包173

27.5导入包174

27.6查看包的帮助175

27.7常用包176

28帮助文档177

28.1 help函数178

28.2 docString178

28.3查看源代码179

28.4 doc属性180

28.5 dir()函数181

28.6其他方法183

第三篇 Python进阶187

29异常与错误187

29.1 try/except/finally188

29.2异常信息的显示模式189

29.3断言190

30程序调试方法192

30.1调试程序的基本方法193

30.2设置错误信息的显示方式194

30.3设置断言的方法195

31面向对象编程197

31.1类的定义方法198

31.2类中的特殊方法199

31.3类之间的继承关系201

31.4私有属性及@property装饰器203

31.5 self和cls204

31.6 new与init的区别和联系205

32魔术命令208

32.1运行.py文件:%run209

32.2统计运行时间:%timeit与%%timeit210

32.3查看历史In和Out变量:32story211

32.4更改异常信息的显示模式:5a0020mode212

32.5调试程序:5898272ebug214

32.6程序运行的逐行统计:005A0020run与00000000run215

32.7内存使用情况的统计:%memit216

33搜索路径218

33.1变量搜索路径219

33.2模块搜索路径221

34当前工作目录224

34.1显示当前工作目录的方法225

34.2更改当前工作目录的方法225

34.3读、写当前工作目录的方法226

第四篇 数据加工229

35随机数229

35.1一次生成一个数230

35.2一次生成一个随机数组231

36数组234

36.1创建方法238

36.2主要特征241

36.3切片/读取243

36.4浅拷贝和深拷贝249

36.5形状和重构250

36.6属性计算254

36.7 ndarray的计算256

36.8 ndarray的元素类型258

36.9插入与删除259

36.10缺失值处理260

36.11 ndarray的广播规则261

36.12 ndarray的排序262

37 Series265

37.1 Series的主要特点266

37.2 Series的定义方法266

37.3 Series的操作方法269

38 DataFrame274

38.1创建方法277

38.2查看行或列278

38.3引用行或列279

38.4 index操作283

38.5删除或过滤行/列285

38.6算术运算290

38.7大小比较运算296

38.8统计信息297

38.9排序299

38.10导入/导出301

38.11缺失数据处理302

38.12分组统计308

39日期与时间311

39.1常用包与模块312

39.2时间和日期类型的定义312

39.3转换方法314

39.4显示系统当前时间316

39.5计算时差317

39.6时间索引317

39.7 period_range()函数320

40可视化321

40.1 Matplotlib可视化323

40.2改变图的属性326

40.3改变图的类型329

40.4改变图的坐标轴的取值范围330

40.5去掉边界的空白332

40.6在同一个坐标上画两个图333

40.7多图显示334

40.8图的保存335

40.9散点图的画法335

40.10 Pandas可视化336

40.11 Seaborn可视化339

40.12数据可视化实战343

41自然语言处理346

41.1自然语言处理的常用包347

41.2自然语言处理的包导入及设置347

41.3数据读入348

41.4分词处理349

41.5自定义词汇350

41.6停用词处理354

41.7词性分布分析356

41.8高频词分析358

41.9词频统计360

41.10关键词分析362

41.11生成词云363

42 Web爬取365

42.1 Scrapy的下载与安装367

42.2 Scrapy Shell的基本原理368

42.3 Scrapy Shell的应用370

42.4自定义Spider类374

42.5综合应用379

第五篇 数据分析389

43统计分析389

43.1业务理解390

43.2数据读入391

43.3数据理解392

43.4数据准备393

43.5模型类型的选择与超级参数的设置394

43.6训练具体模型及查看其统计量396

43.7拟合优度评价397

43.8建模前提假定的讨论398

43.9模型的优化与重新选择400

43.10模型的应用404

44机器学习405

44.1机器学习的业务理解406

44.2数据读入407

44.3数据理解408

44.4数据准备411

44.5算法选择及其超级参数的设置414

44.6具体模型的训练415

44.7用模型进行预测415

44.8模型评价416

44.9模型的应用与优化417

第六篇 大数据处理421

45 Spark编程421

45.1导入pyspark包423

45.2 SparkSession及其创建423

45.3 Spark数据抽象类型426

45.4 Spark DataFrame操作429

45.5 SQL编程433

45.6 DataFrame的可视化436

45.7 Spark机器学习438

45.7.1创建Spark Session439

45.7.2读入数据439

45.7.3数据理解440

45.7.4数据准备440

45.7.5模型训练442

45.7.6模型评价442

45.7.7预测443

46 Spark Python开发环境的搭建445

46.1安装Anaconda446

46.2安装和配置Java449

46.3安装和配置Spark451

46.4安装和配置Hadoop454

46.5测试Spark455

47 NoSQL数据库456

47.1下载Memcached457

47.2安装Memcached457

47.3安装和导入包pYmemcache459

47.4准备试验数据460

47.5定义Client并进行数据读写460

47.6 Memcached的更多操作462

第七篇 继续学习467

48 Python初学者常见错误及纠正方法467

48.1 NameError:name ‘xxxx’ is not defined467

48.2 IndentationError:unexpected indent468

48.3 SyntaxError:invalid character in identifier469

48.4 TypeError:‘XXXX’ object does not support item assignment470

48.5 TypeError:unsupported operand type(s) for XXXX470

48.6 IndexError:list index out of range471

48.7 TypeError:type() takes XXXX arguments472

48.8 SyntaxError:unexpected EOF while parsing472

48.9 ModuleNotFoundError:No module named XXXX473

48.10 TypeError:‘list’ object is not callable474

48.11 SyntaxError:invalid syntax475

48.12 AttributeError:XXXX object has no attribute XXXX476

48.13 TypeError :XXXX object is not an iterator477

48.14 FileNotFoundError:File XXXX does not exist478

48.15 IndexError:too many indices for array480

48.16 TypeError:Required argument XXXX not found481

48.17 TypeError:an XXXX is required (got type YYYY)482

48.18 ValueError:Wrong number of items passed XXXX,placement implies YYYY483

49 Python数据分析和数据科学面试题485

50继续学习本书内容的推荐资源496

50.1重要网站496

50.2重要图书497

50.3常用模块与工具包497

50.4常用统计模型497

50.5核心机器学习算法498

50.6继续学习数据科学的建议路线图499

参考文献503

热门推荐