图书介绍
Python编程 从数据分析到数据科学PDF|Epub|txt|kindle电子书版本网盘下载
- 朝乐门著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121344404
- 出版时间:2019
- 标注页数:504页
- 文件大小:40MB
- 文件页数:519页
- 主题词:软件工具-程序设计-高等学校-教材
PDF下载
下载说明
Python编程 从数据分析到数据科学PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一篇 准备工作3
1为什么要学习Python?学习Python的什么3
2学习Python之前需要准备的工作有哪些6
3如何看和运行本书代码8
3.1输入部分8
3.2输出部分10
3.3错误与异常信息11
3.4外部数据文件12
3.5注意事项14
第二篇 Python基础19
4数据类型19
4.1查看数据类型的方法20
4.2判断数据类型的方法21
4.3转换数据类型的方法22
4.4特殊数据类型23
4.5序列类型26
5变量28
5.1变量的定义方法29
5.2 Python是动态类型语言29
5.3 Python是强类型语言30
5.4 Python中的变量名是引用31
5.5 Python中区分大小写32
5.6变量命名规范32
5.7 iPython的特殊变量33
5.8查看Python关键字的方法34
5.9查看已定义的所有变量35
5.10删除变量37
6语句书写规范39
6.1一行一句40
6.2一行多句40
6.3一句多行41
6.4复合语句42
6.5空语句43
7赋值语句44
7.1赋值语句在Python中的重要地位45
7.2链式赋值语句45
7.3复合赋值语句46
7.4序列的拆包式赋值46
7.5两个变量值的调换47
8注释语句48
8.1注释方法48
8.2注意事项49
9运算符50
9.1特殊运算符53
9.2内置函数57
9.3 math模块58
9.4优先级与结合方向59
10 if语句61
10.1基本语法61
10.2 elif语句62
10.3 if与三元运算63
10.4注意事项64
11 for语句67
11.1基本语法67
11.2 range()函数67
11.3注意事项68
12 while语句71
12.1基本语法71
122注意事项72
13 pass语句74
13.1含义74
13.2作用75
14列表76
14.1定义方法78
14.2切片操作79
14.3反向遍历81
14.4类型转换83
14.5 extend与append的区别83
14.6列表推导式84
14.7插入与删除87
14.8常用操作函数89
15元组94
15.1定义方法95
15.2主要特征97
15.3基本用法99
15.4应用场景100
16字符串103
16.1定义方法104
16.2主要特征105
16.3字符串的操作106
17序列111
17.1支持索引112
17.2支持切片113
17.3支持迭代114
17.4支持拆包114
17.5支持*运算115
17.6通用函数117
18集合120
18.1定义方法121
18.2主要特征122
18.3基本运算123
18.4应用场景125
19字典126
19.1定义方法127
19.2字典的主要特征128
19.3字典的应用场景129
20迭代器与生成器130
20.1可迭代对象与迭代器131
20.2生成器与迭代器132
21函数134
21.1内置函数135
21.2模块函数135
21.3用户自定义函数136
22内置函数137
22.1内置函数的主要特点138
22.2数学函数138
22.3类型函数139
22.4其他功能函数140
23模块函数145
23.1 import模块名146
23.2 import模块名as别名147
23.3 from模块名import函数名147
24自定义函数149
24.1定义方法151
24.2函数中的docString152
24.3调用方法152
24.4返回值153
24.5自定义函数的形参与实参154
24.6变量的可见性156
24.7值传递与地址传递158
24.8自定义函数时的注意事项160
25 lambda函数162
25.1 lambda函数的定义方法163
25.2 lambda函数的调用方法164
26模块166
26.1导入与调用用法167
26.2查看内置模块清单的方法168
27包171
27.1相关术语172
27.2安装包172
27.3查看已安装包173
27.4更新(或删除)已安装包173
27.5导入包174
27.6查看包的帮助175
27.7常用包176
28帮助文档177
28.1 help函数178
28.2 docString178
28.3查看源代码179
28.4 doc属性180
28.5 dir()函数181
28.6其他方法183
第三篇 Python进阶187
29异常与错误187
29.1 try/except/finally188
29.2异常信息的显示模式189
29.3断言190
30程序调试方法192
30.1调试程序的基本方法193
30.2设置错误信息的显示方式194
30.3设置断言的方法195
31面向对象编程197
31.1类的定义方法198
31.2类中的特殊方法199
31.3类之间的继承关系201
31.4私有属性及@property装饰器203
31.5 self和cls204
31.6 new与init的区别和联系205
32魔术命令208
32.1运行.py文件:%run209
32.2统计运行时间:%timeit与%%timeit210
32.3查看历史In和Out变量:32story211
32.4更改异常信息的显示模式:5a0020mode212
32.5调试程序:5898272ebug214
32.6程序运行的逐行统计:005A0020run与00000000run215
32.7内存使用情况的统计:%memit216
33搜索路径218
33.1变量搜索路径219
33.2模块搜索路径221
34当前工作目录224
34.1显示当前工作目录的方法225
34.2更改当前工作目录的方法225
34.3读、写当前工作目录的方法226
第四篇 数据加工229
35随机数229
35.1一次生成一个数230
35.2一次生成一个随机数组231
36数组234
36.1创建方法238
36.2主要特征241
36.3切片/读取243
36.4浅拷贝和深拷贝249
36.5形状和重构250
36.6属性计算254
36.7 ndarray的计算256
36.8 ndarray的元素类型258
36.9插入与删除259
36.10缺失值处理260
36.11 ndarray的广播规则261
36.12 ndarray的排序262
37 Series265
37.1 Series的主要特点266
37.2 Series的定义方法266
37.3 Series的操作方法269
38 DataFrame274
38.1创建方法277
38.2查看行或列278
38.3引用行或列279
38.4 index操作283
38.5删除或过滤行/列285
38.6算术运算290
38.7大小比较运算296
38.8统计信息297
38.9排序299
38.10导入/导出301
38.11缺失数据处理302
38.12分组统计308
39日期与时间311
39.1常用包与模块312
39.2时间和日期类型的定义312
39.3转换方法314
39.4显示系统当前时间316
39.5计算时差317
39.6时间索引317
39.7 period_range()函数320
40可视化321
40.1 Matplotlib可视化323
40.2改变图的属性326
40.3改变图的类型329
40.4改变图的坐标轴的取值范围330
40.5去掉边界的空白332
40.6在同一个坐标上画两个图333
40.7多图显示334
40.8图的保存335
40.9散点图的画法335
40.10 Pandas可视化336
40.11 Seaborn可视化339
40.12数据可视化实战343
41自然语言处理346
41.1自然语言处理的常用包347
41.2自然语言处理的包导入及设置347
41.3数据读入348
41.4分词处理349
41.5自定义词汇350
41.6停用词处理354
41.7词性分布分析356
41.8高频词分析358
41.9词频统计360
41.10关键词分析362
41.11生成词云363
42 Web爬取365
42.1 Scrapy的下载与安装367
42.2 Scrapy Shell的基本原理368
42.3 Scrapy Shell的应用370
42.4自定义Spider类374
42.5综合应用379
第五篇 数据分析389
43统计分析389
43.1业务理解390
43.2数据读入391
43.3数据理解392
43.4数据准备393
43.5模型类型的选择与超级参数的设置394
43.6训练具体模型及查看其统计量396
43.7拟合优度评价397
43.8建模前提假定的讨论398
43.9模型的优化与重新选择400
43.10模型的应用404
44机器学习405
44.1机器学习的业务理解406
44.2数据读入407
44.3数据理解408
44.4数据准备411
44.5算法选择及其超级参数的设置414
44.6具体模型的训练415
44.7用模型进行预测415
44.8模型评价416
44.9模型的应用与优化417
第六篇 大数据处理421
45 Spark编程421
45.1导入pyspark包423
45.2 SparkSession及其创建423
45.3 Spark数据抽象类型426
45.4 Spark DataFrame操作429
45.5 SQL编程433
45.6 DataFrame的可视化436
45.7 Spark机器学习438
45.7.1创建Spark Session439
45.7.2读入数据439
45.7.3数据理解440
45.7.4数据准备440
45.7.5模型训练442
45.7.6模型评价442
45.7.7预测443
46 Spark Python开发环境的搭建445
46.1安装Anaconda446
46.2安装和配置Java449
46.3安装和配置Spark451
46.4安装和配置Hadoop454
46.5测试Spark455
47 NoSQL数据库456
47.1下载Memcached457
47.2安装Memcached457
47.3安装和导入包pYmemcache459
47.4准备试验数据460
47.5定义Client并进行数据读写460
47.6 Memcached的更多操作462
第七篇 继续学习467
48 Python初学者常见错误及纠正方法467
48.1 NameError:name ‘xxxx’ is not defined467
48.2 IndentationError:unexpected indent468
48.3 SyntaxError:invalid character in identifier469
48.4 TypeError:‘XXXX’ object does not support item assignment470
48.5 TypeError:unsupported operand type(s) for XXXX470
48.6 IndexError:list index out of range471
48.7 TypeError:type() takes XXXX arguments472
48.8 SyntaxError:unexpected EOF while parsing472
48.9 ModuleNotFoundError:No module named XXXX473
48.10 TypeError:‘list’ object is not callable474
48.11 SyntaxError:invalid syntax475
48.12 AttributeError:XXXX object has no attribute XXXX476
48.13 TypeError :XXXX object is not an iterator477
48.14 FileNotFoundError:File XXXX does not exist478
48.15 IndexError:too many indices for array480
48.16 TypeError:Required argument XXXX not found481
48.17 TypeError:an XXXX is required (got type YYYY)482
48.18 ValueError:Wrong number of items passed XXXX,placement implies YYYY483
49 Python数据分析和数据科学面试题485
50继续学习本书内容的推荐资源496
50.1重要网站496
50.2重要图书497
50.3常用模块与工具包497
50.4常用统计模型497
50.5核心机器学习算法498
50.6继续学习数据科学的建议路线图499
参考文献503