图书介绍
R语言商业分析实战PDF|Epub|txt|kindle电子书版本网盘下载
![R语言商业分析实战](https://www.shukui.net/cover/70/34525800.jpg)
- (美)Dr. Umesh R. Hodeghatta Umesha Nayak著;王胜夏,杨莉灵 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302489665
- 出版时间:2018
- 标注页数:228页
- 文件大小:26MB
- 文件页数:243页
- 主题词:程序语言-应用-商业管理
PDF下载
下载说明
R语言商业分析实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 商业分析简介1
1.1本书目的3
1.2容易混淆的术语3
1.3商业分析的发展动因4
1.3.1计算机软件包和应用程序的增长5
1.3.2整合各种数据源的可行性5
1.3.3无限存储和计算能力的增长6
1.3.4简单易用的编程工具和平台6
1.3.5竞争激烈世界中的生存与发展6
1.3.6全球化商业的复杂性6
1.4商业分析的应用6
1.4.1市场营销与销售7
1.4.2人力资源7
1.4.3产品设计7
1.4.4服务设计8
1.4.5客户服务和支持范围8
1.5商业分析师的必备技能8
1.5.1理解商业和商业问题8
1.5.2理解数据分析技术和算法9
1.5.3具备良好的计算机编程知识9
1.5.4理解数据结构和数据存储/仓储技术9
1.5.5了解统计学和数学的相关概念知识9
1.6商业分析项目的分析过程10
1.7商业分析框架11
1.8小结12
第2章 R语言概述13
2.1数据分析工具13
2.2 R语言安装16
2.2.1安装R语言16
2.2.2安装RStudio17
2.2.3探索RStudio界面18
2.3 R编程基础19
2.3.1赋值20
2.3.2创建向量21
2.4 R语言对象类型21
2.5 R语言的数据结构23
2.5.1矩阵23
2.5.2数组24
2.5.3数据框26
2.5.4列表27
2.5.5因子28
2.6小结29
第3章 R语言数据分析31
3.1读写数据31
3.1.1从文本文件读取数据32
3.1.2从Microsoft Excel文件读取数据35
3.1.3从Web读取数据37
3.2在R语言中使用控制结构37
3.2.1 if-else38
3.2.2 for循环39
3.2.3 while循环39
3.2.4循环功能40
3.2.5在R语言中自编函数47
3.3使用R语言软件包和库48
3.4小结49
第4章 描述性分析概述51
4.1描述性分析54
4.2总体和样本54
4.3有关的统计参数55
4.3.1均值55
4.3.2中位数57
4.3.3众数59
4.3.4全距59
4.3.5分位数60
4.3.6标准差(Standard Deviation)61
4.3.7方差(Variance)64
4.3.8 R语言的summary命令64
4.4数据的图形描述65
4.4.1 R语言的plot命令65
4.4.2直方图67
4.4.3条形图68
4.4.4箱线图68
4.5数据框计算69
4.6概率73
4.6.1互斥事件的概率74
4.6.2相互独立事件的概率74
4.6.3非互斥事件概率75
4.6.4概率分布75
4.7小结77
第5章 商业分析过程与数据探索79
5.1商业分析过程79
5.1.1第一阶段:理解商业问题79
5.1.2第二阶段:收集和整合数据79
5.1.3第三阶段:预处理数据80
5.1.4第四阶段:探索和可视化数据80
5.1.5第五阶段:选择建模技术和算法81
5.1.6第六阶段:评估模型81
5.1.7第七阶段:管理和审查报告81
5.1.8第八阶段:部署模型81
5.2理解商业问题82
5.3收集和整合数据82
5.3.1抽样83
5.3.2变量选择84
5.4预处理数据85
5.4.1数据类型85
5.4.2数据准备86
5.4.3使用R语言进行数据预处理87
5.5数据探索和数据可视化91
5.5.1表格92
5.5.2汇总表92
5.5.3图形93
5.5.4散点图矩阵97
5.5.5数据转换101
5.6使用建模技术和算法102
5.6.1描述性分析103
5.6.2预测分析103
5.6.3机器学习103
5.7评估模型106
5.7.1训练数据分区106
5.7.2测试数据分区106
5.7.3验证数据分区107
5.7.4交叉验证107
5.7.5分类模型评估108
5.7.6回归模型评估111
5.8提交管理报告和审查112
5.8.1描述问题112
5.8.2使用的数据集112
5.8.3执行数据清洗112
5.8.4创建模型的方法112
5.8.5模型部署前提条件113
5.8.6模型部署和使用113
5.8.7问题处理113
5.9部署模型113
5.10小结114
第6章 监督机器学习:分类115
6.1什么是分类?什么是预测?115
6.2概率分类器模型116
6.2.1示例117
6.2.2 R语言朴素贝叶斯分类器118
6.2.3朴素贝叶斯分类器的优点和局限性119
6.3决策树120
6.3.1递归分割决策树算法121
6.3.2信息增益121
6.3.3决策树示例123
6.3.4决策树归纳124
6.3.5树分类规则127
6.3.6过拟合和欠拟合127
6.3.7偏差和方差(Bias and Variance)128
6.3.8避免过拟合误差和确定决策树生长的规模129
6.4其他分类器类型131
6.4.1 K-最近邻131
6.4.2随机森林132
6.5 R语言分类示例134
6.6小结138
第7章 无监督机器学习139
7.1聚类概述139
7.2什么是聚类140
7.2.1两个记录之间的测量方法141
7.2.2分类变量的距离度量142
7.2.3混合型数据的距离度量142
7.2.4两个聚类之间的距离143
7.3层次聚类145
7.3.1树状图145
7.3.2层次聚类的局限性145
7.4非层次聚类146
7.4.1 k-means算法146
7.4.2 k-means聚类的局限性147
7.5聚类案例研究148
7.5.1仅保留数据集中的相关变量149
7.5.2从数据集中删除任何异常值149
7.5.3数据归一化(Standardize the Data)150
7.5.4计算数据点之间的距离150
7.6关联规则157
7.6.1选择规则158
7.6.2关联规则生成示例160
7.6.3解读结果161
7.7小结162
第8章 简单线性回归分析163
8.1概述163
8.2相关性164
8.3假设检验167
8.4简单线性回归分析168
8.4.1回归假设168
8.4.2简单线性回归方程168
8.4.3 R语言创建简单回归方程169
8.4.4检验回归假设171
8.4.5结论176
8.4.6预测响应变量176
8.4.7补充说明177
8.5小结178
第9章 多元线性回归分析179
9.1使用多元线性回归分析180
9.1.1数据181
9.1.2相关性181
9.1.3构建模型182
9.1.4验证回归假设184
9.1.5多重共线性188
9.1.6逐步多元线性回归分析190
9.1.7全子集多元线性回归分析191
9.1.8多元线性回归方程193
9.1.9结论193
9.2 R语言的替代方法193
9.3预测响应变量194
9.4 训练和测试模型195
9.5交叉验证196
9.6小结198
第10章 逻辑回归分析201
10.1逻辑回归202
10.1.1数据203
10.1.2构建模型204
10.1.3模型拟合验证207
10.1.4一般注意事项208
10.1.5多重共线性208
10.1.6离散209
10.1.7逻辑回归分析结论209
10.2模型训练和测试209
10.2.1预测响应变量211
10.2.2验证逻辑回归模型的其他替代方法212
10.3多项逻辑回归分析213
10.4正则化214
10.5小结220
第11章 大数据分析:介绍及未来趋势221
11.1大数据生态系统222
11.2大数据分析的未来趋势225
11.2.1发展壮大的社交媒体225
11.2.2创建数据湖225
11.2.3企业用户手中的可视化工具225
11.2.4规范性分析225
11.2.5物联网226
11.2.6人工智能226
11.2.7全数据处理226
11.2.8数据垂直应用和横向应用226
11.2.9实时分析226
11.2.10将数据分析工具交由企业用户使用227
11.2.11将解决方案从一个工具迁移到另一个工具227
11.2.12云无处不在227
11.2.13数据库内分析227
11.2.14内存分析228
11.2.15 机器学习的自主服务228
11.2.16安全和合规性228
11.2.17医疗保健228