图书介绍
属性数据分析引论PDF|Epub|txt|kindle电子书版本网盘下载
![属性数据分析引论](https://www.shukui.net/cover/44/30114455.jpg)
- Alan Agresti著 著
- 出版社: 北京:高等教育出版社
- ISBN:9787040247510
- 出版时间:2008
- 标注页数:318页
- 文件大小:160MB
- 文件页数:338页
- 主题词:社会调查-统计分析-统计程序
PDF下载
下载说明
属性数据分析引论PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 导言1
1.1 属性响应数据1
1.1.1 响应变量和解释变量的区别2
1.1.2 名义量表和有序量表的区别2
1.1.3 本书的结构3
1.2 属性数据的概率分布3
1.2.1 二项分布3
1.2.2 多项分布5
1.3 比例的统计推断5
1.3.1 似然函数和极大似然估计5
1.3.2 二项比例的显著性检验7
1.3.3 案例:关于堕胎合法化的调查结果7
1.3.4 二项比例的置信区间8
1.4 关于离散数据的更多统计推断9
1.4.1 Wald,似然比和得分推断9
1.4.2 二项参数的Wald,得分和似然比推断11
1.4.3 小样本二项推断11
1.4.4 小样本离散数据推断的保守性12
1.4.5 基于中间P-值的推断13
1.4.6 小结13
习题14
第2章 列联表18
2.1 列联表的概率结构18
2.1.1 联合概率,边缘概率以及条件概率19
2.1.2 案例:关于来世19
2.1.3 诊断检验的敏感度和特异度20
2.1.4 独立性21
2.1.5 二项抽样和多项抽样21
2.2 2×2表比例的比较22
2.2.1 比例差22
2.2.2 案例:阿司匹林与心脏病22
2.2.3 相对风险23
2.3 优势比24
2.3.1 优势比的性质24
2.3.2 案例:阿司匹林和心脏病案例中的优势比25
2.3.3 优势比和对数优势比的推断25
2.3.4 优势比和相对风险的联系27
2.3.5 案例对照研究中优势比的应用27
2.3.6 观测研究的种类28
2.4 独立性的卡方检验29
2.4.1 皮尔逊统计量和卡方分布29
2.4.2 似然比统计量30
2.4.3 独立性检验31
2.4.4 案例:政党认同中的性别差异31
2.4.5 列联表的单元残差32
2.4.6 卡方统计量的分解33
2.4.7 卡方检验的小结34
2.5 有序数据的独立性检验34
2.5.1 线性趋势与独立性35
2.5.2 案例:饮酒与婴儿畸形35
2.5.3 有序检验的特殊功效36
2.5.4 得分的选择37
2.5.5 I×2表和2×J表趋势的检验38
2.5.6 名义变量—有序变量列联表38
2.6 小样本的精确推断38
2.6.1 2×2表的费希尔精确检验38
2.6.2 案例:费希尔的品茶者试验39
2.6.3 P-值和真实P-值的保守性(第I类错误)40
2.6.4 优势比的小样本置信区间41
2.7 三向列联表的关联性41
2.7.1 部分表42
2.7.2 条件关联与边缘关联:死刑判决的案例42
2.7.3 辛普森悖论43
2.7.4 条件优势比和边缘优势比44
2.7.5 条件独立和边缘独立45
2.7.6 齐次关联性46
习题46
第3章 广义线性模型55
3.1 广义线性模型的构成部分55
3.1.1 随机部分56
3.1.2 系统部分56
3.1.3 联系函数56
3.1.4 正态GLM57
3.2 二分数据的广义线性模型57
3.2.1 线性概率模型58
3.2.2 案例:打鼾与心脏病58
3.2.3 logistic回归模型59
3.2.4 probit回归模型61
3.2.5 二分回归和累积分布函数61
3.3 计数数据的广义线性模型62
3.3.1 泊松回归63
3.3.2 案例:母鲎及其追随者64
3.3.3 超散布性:超出预期的变异性67
3.3.4 负二项分布68
3.3.5 比率数据的计数回归69
3.3.6 案例:英国的火车事故69
3.4 统计推断和模型检验70
3.4.1 关于模型参数的推断70
3.4.2 案例:再访打鼾与心脏病的案例71
3.4.3 偏差71
3.4.4 基于偏差的模型比较72
3.4.5 比较观测和模型拟合的残差72
3.5 广义线性模型的拟合73
3.5.1 GLM拟合的Newton-Raphson算法73
3.5.2 依赖于似然函数的Wald,似然比以及得分推断74
3.5.3 GLM的优势75
习题75
第4章 logistic回归83
4.1 logistic回归模型的解释83
4.1.1 线性近似解释84
4.1.2 母鲎:观察并平滑二分结果85
4.1.3 鲎:logistic回归拟合的解释86
4.1.4 优势比解释88
4.1.5 回顾性研究中的logistic回归88
4.1.6 X服从正态分布意味着Y适合logistic回归89
4.2 logistic回归的推断89
4.2.1 分组或未分组的二分数据89
4.2.2 效应的置信区间90
4.2.3 显著性检验90
4.2.4 概率的置信区间91
4.2.5 为什么使用模型估计概率?91
4.2.6 概率的置信区间:细节91
4.2.7 模型参数估计的标准误92
4.3 属性预测变量的logistic回归93
4.3.1 用指示变量表示属性预测变量93
4.3.2 案例:AZT和AIDS94
4.3.3 因子的ANOVA型模型表示95
4.3.4 2×2×K列联表的Cochran-Mantel-Haenszel检验96
4.3.5 优势比齐次性检验97
4.4 多元logistic回归97
4.4.1 案例:以颜色和宽度作为预测变量的母鲎案例97
4.4.2 通过模型对比确认某项是否必要99
4.4.3 有序预测变量的定量化处理100
4.4.4 容许交互效应101
4.5 logistic回归效应的概括101
4.5.1 基于概率的解释101
4.5.2 标准化解释102
习题103
第5章 logistic回归模型的构建及应用115
5.1 模型选择策略115
5.1.1 运用多少个预测变量?115
5.1.2 案例:再访鲎的数据116
5.1.3 逐步变量选择算法117
5.1.4 案例:鲎数据的向后剔除118
5.1.5 AIC,模型选择及“正确”模型118
5.1.6 概括预测功效:分类表119
5.1.7 概括预测功效:ROC曲线120
5.1.8 概括预测功效:相关121
5.2 模型检验121
5.2.1 模型比较的似然比检验122
5.2.2 拟合优度与偏差122
5.2.3 检验拟合:分组数据,未分组数据及连续预测变量123
5.2.4 logit模型的残差124
5.2.5 案例:佛罗里达大学的研究生入学125
5.2.6 logistic回归的影响诊断126
5.2.7 案例:心脏病与血压的关系127
5.3 稀疏数据效应128
5.3.1 无穷效应估计:定量预测变量128
5.3.2 无穷效应估计:属性预测变量129
5.3.3 案例:带有稀疏数据的临床试验结果130
5.3.4 小样本对X2和G2检验的影响131
5.4 条件logistic回归与精确推断132
5.4.1 条件极大似然推断132
5.4.2 列联表的小样本检验133
5.4.3 案例:晋升能力133
5.4.4 logistic参数和优势比的小样本置信区间134
5.4.5 小样本精确方法的局限性134
5.5 logistic回归的样本量与功效135
5.5.1 比较两个比例所需的样本量135
5.5.2 logistic回归中的样本量136
5.5.3 多重logistic回归中的样本量137
习题137
第6章 多类别logit模型146
6.1 名义响应变量的logit模型146
6.1.1 基线-类别logit146
6.1.2 案例:钝吻鳄食物选择147
6.1.3 估计响应概率149
6.1.4 案例:是否相信来世150
6.1.5 离散选择模型151
6.2 有序响应变量的累积logit模型152
6.2.1 具有比例优势特性的累积logit模型152
6.2.2 案例:政治意识形态与隶属党派的关系154
6.2.3 模型参数的推断155
6.2.4 模型拟合的检验156
6.2.5 案例:对心理健康建模157
6.2.6 比较累积概率的解释158
6.2.7 潜变量诱导159
6.2.8 响应类别选择的不变性160
6.3 成对类别有序logit160
6.3.1 相邻类别logit161
6.3.2 案例:再访政治意识形态161
6.3.3 相继比logit161
6.3.4 案例:发育毒性研究162
6.3.5 聚簇数据中的超散布性163
6.4 条件独立性检验163
6.4.1 案例:工作满意度和收入163
6.4.2 推广的Cochran-Mantel-Haenszel检验165
6.4.3 探测名义-有序条件关联165
6.4.4 探测名义-名义条件关联166
习题166
第7章 列联表的对数线性模型173
7.1 双向表和三向表的对数线性模型173
7.1.1 双向表的独立性对数线性模型174
7.1.2 独立性模型中的参数解释174
7.1.3 双向表的饱和模型175
7.1.4 三向表的对数线性模型177
7.1.5 两因子参数描述条件关联177
7.1.6 案例:酒、香烟、大麻的使用178
7.2 对数线性模型的推断180
7.2.1 卡方拟合优度检验180
7.2.2 对数线性单元残差181
7.2.3 条件关联的检验182
7.2.4 条件优势比的置信区间182
7.2.5 高维对数线性模型183
7.2.6 案例:汽车事故与安全带183
7.2.7 三因子交互作用185
7.2.8 大样本和统计与实践显著性186
7.3 对数线性模型与logistic模型的联系186
7.3.1 利用logistic模型解释对数线性模型187
7.3.2 案例:再访汽车事故数据187
7.3.3 对数线性模型和logistic模型间的对应188
7.3.4 模型选择策略189
7.4 独立图和衰退189
7.4.1 独立图190
7.4.2 三向表的衰退条件190
7.4.3 衰退与logistic模型191
7.4.4 多向表的衰退与独立图192
7.4.5 案例:学生成瘾物质使用的模型构建192
7.4.6 图模型194
7.5 对有序关联建模194
7.5.1 线性—线性关联模型196
7.5.2 案例:性选择197
7.5.3 有序的独立性检验197
习题198
第8章 配对数据的模型209
8.1 比较关联样本的比例210
8.1.1 比较边缘比例的McNemar检验210
8.1.2 比例的差的估计211
8.2 配对的logistic回归212
8.2.1 针对边缘比例的边缘模型212
8.2.2 特定个体表与平均总体表212
8.2.3 配对的条件logistic回归213
8.2.4 匹配案例对照研究的logistic回归214
8.2.5 McNemar与Cochran-Mantel-Haenszel检验的联系216
8.3 比较方形列联表的边缘分布216
8.3.1 边缘齐性与名义分类216
8.3.2 案例:咖啡品牌市场份额217
8.3.3 边缘齐性与有序类别218
8.3.4 案例:为了环保,再利用或少开车?219
8.4 方形表的对称性模型与拟对称性模型219
8.4.1 以logistic模型表示的对称性220
8.4.2 拟对称性220
8.4.3 案例:再访咖啡品牌市场份额220
8.4.4 利用对称性和拟对称性来检验边缘齐性221
8.4.5 有序拟对称性模型221
8.4.6 案例:再利用或少开车?222
8.4.7 利用对称性模型与有序拟对称性模型来检验边缘齐性222
8.5 分析评级者的一致性222
8.5.1 独立性模型的单元残差223
8.5.2 拟独立性模型224
8.5.3 概括一致性的优势比225
8.5.4 拟对称性和一致性建模225
8.5.5 一致性的kappa度量226
8.6 成对偏好的BRADLEY-TERRY模型226
8.6.1 Bradley-Terry模型227
8.6.2 案例:对男子网球选手排序227
习题228
第9章 关联,聚簇响应的建模235
9.1 边缘模型及条件模型236
9.1.1 聚簇二分响应的边缘模型236
9.1.2 案例:抑郁症治疗的纵向研究236
9.1.3 重复响应的条件模型237
9.2 边缘模型:广义估计方程(GEE)方法238
9.2.1 拟似然方法238
9.2.2 广义估计方程方法:基本思想239
9.2.3 二分数据的GEE:抑郁症的研究240
9.2.4 案例:畸胎学中的超散布性241
9.2.5 与ML相比,GEE的局限性242
9.3 GEE的扩展:多项响应242
9.3.1 聚簇多项响应的边缘模型242
9.3.2 案例:关于失眠的研究243
9.3.3 利用GEE对关联性进行建模的另一种方法244
9.3.4 缺失数据的处理244
9.4 给定既往的转移模型245
9.4.1 含有解释变量的转移模型245
9.4.2 案例:呼吸疾病和母亲吸烟245
9.4.3 控制初始响应的比较246
9.4.4 和对数线性模型有关的转移模型247
习题247
第10章 随机效应:广义线性混合模型253
10.1 聚簇属性数据的随机效应建模253
10.1.1 广义线性混合模型253
10.1.2 二分配对的logistic GLMM254
10.1.3 案例:再访对环保的贡献问题255
10.1.4 条件模型与边缘模型的不同效应256
10.2 二分数据的随机效应模型的案例257
10.2.1 二项分布概率的小区域估计257
10.2.2 案例:估计篮球罚球成功率258
10.2.3 案例:再访畸形研究超离散化问题259
10.2.4 案例:相似调查问题的重复响应260
10.2.5 项目反应模型:Rasch模型261
10.2.6 案例:再访抑郁症研究262
10.2.7 边缘模型和条件模型的选择263
10.2.8 条件模型:随机效应与条件ML264
10.3 向多项响应或多个随机效应项的推广264
10.3.1 案例:再访失眠研究264
10.3.2 随机效应与关联异质性265
10.4 多水平(层次)模型267
10.4.1 案例:关于学生进级的两水平模型268
10.4.2 案例:留级268
10.5 GLMM的模型拟合与推断269
10.5.1 拟合GLMM269
10.5.2 模型参数的推断270
习题271
第11章 属性数据分析史漫谈277
11.1 PEARSON-YULE关联性的争议277
11.2 R.A.FISHER的贡献278
11.3 logistic回归279
11.4 多向列联表和对数线性模型280
11.5 最后的一点评论282
附录A:针对属性数据分析的软件283
附录B:卡方分布表293
参考文献294
案例索引296
名词索引299
部分奇数号习题的简要答案306