图书介绍

属性数据分析引论PDF|Epub|txt|kindle电子书版本网盘下载

属性数据分析引论
  • Alan Agresti著 著
  • 出版社: 北京:高等教育出版社
  • ISBN:9787040247510
  • 出版时间:2008
  • 标注页数:318页
  • 文件大小:160MB
  • 文件页数:338页
  • 主题词:社会调查-统计分析-统计程序

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

属性数据分析引论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 导言1

1.1 属性响应数据1

1.1.1 响应变量和解释变量的区别2

1.1.2 名义量表和有序量表的区别2

1.1.3 本书的结构3

1.2 属性数据的概率分布3

1.2.1 二项分布3

1.2.2 多项分布5

1.3 比例的统计推断5

1.3.1 似然函数和极大似然估计5

1.3.2 二项比例的显著性检验7

1.3.3 案例:关于堕胎合法化的调查结果7

1.3.4 二项比例的置信区间8

1.4 关于离散数据的更多统计推断9

1.4.1 Wald,似然比和得分推断9

1.4.2 二项参数的Wald,得分和似然比推断11

1.4.3 小样本二项推断11

1.4.4 小样本离散数据推断的保守性12

1.4.5 基于中间P-值的推断13

1.4.6 小结13

习题14

第2章 列联表18

2.1 列联表的概率结构18

2.1.1 联合概率,边缘概率以及条件概率19

2.1.2 案例:关于来世19

2.1.3 诊断检验的敏感度和特异度20

2.1.4 独立性21

2.1.5 二项抽样和多项抽样21

2.2 2×2表比例的比较22

2.2.1 比例差22

2.2.2 案例:阿司匹林与心脏病22

2.2.3 相对风险23

2.3 优势比24

2.3.1 优势比的性质24

2.3.2 案例:阿司匹林和心脏病案例中的优势比25

2.3.3 优势比和对数优势比的推断25

2.3.4 优势比和相对风险的联系27

2.3.5 案例对照研究中优势比的应用27

2.3.6 观测研究的种类28

2.4 独立性的卡方检验29

2.4.1 皮尔逊统计量和卡方分布29

2.4.2 似然比统计量30

2.4.3 独立性检验31

2.4.4 案例:政党认同中的性别差异31

2.4.5 列联表的单元残差32

2.4.6 卡方统计量的分解33

2.4.7 卡方检验的小结34

2.5 有序数据的独立性检验34

2.5.1 线性趋势与独立性35

2.5.2 案例:饮酒与婴儿畸形35

2.5.3 有序检验的特殊功效36

2.5.4 得分的选择37

2.5.5 I×2表和2×J表趋势的检验38

2.5.6 名义变量—有序变量列联表38

2.6 小样本的精确推断38

2.6.1 2×2表的费希尔精确检验38

2.6.2 案例:费希尔的品茶者试验39

2.6.3 P-值和真实P-值的保守性(第I类错误)40

2.6.4 优势比的小样本置信区间41

2.7 三向列联表的关联性41

2.7.1 部分表42

2.7.2 条件关联与边缘关联:死刑判决的案例42

2.7.3 辛普森悖论43

2.7.4 条件优势比和边缘优势比44

2.7.5 条件独立和边缘独立45

2.7.6 齐次关联性46

习题46

第3章 广义线性模型55

3.1 广义线性模型的构成部分55

3.1.1 随机部分56

3.1.2 系统部分56

3.1.3 联系函数56

3.1.4 正态GLM57

3.2 二分数据的广义线性模型57

3.2.1 线性概率模型58

3.2.2 案例:打鼾与心脏病58

3.2.3 logistic回归模型59

3.2.4 probit回归模型61

3.2.5 二分回归和累积分布函数61

3.3 计数数据的广义线性模型62

3.3.1 泊松回归63

3.3.2 案例:母鲎及其追随者64

3.3.3 超散布性:超出预期的变异性67

3.3.4 负二项分布68

3.3.5 比率数据的计数回归69

3.3.6 案例:英国的火车事故69

3.4 统计推断和模型检验70

3.4.1 关于模型参数的推断70

3.4.2 案例:再访打鼾与心脏病的案例71

3.4.3 偏差71

3.4.4 基于偏差的模型比较72

3.4.5 比较观测和模型拟合的残差72

3.5 广义线性模型的拟合73

3.5.1 GLM拟合的Newton-Raphson算法73

3.5.2 依赖于似然函数的Wald,似然比以及得分推断74

3.5.3 GLM的优势75

习题75

第4章 logistic回归83

4.1 logistic回归模型的解释83

4.1.1 线性近似解释84

4.1.2 母鲎:观察并平滑二分结果85

4.1.3 鲎:logistic回归拟合的解释86

4.1.4 优势比解释88

4.1.5 回顾性研究中的logistic回归88

4.1.6 X服从正态分布意味着Y适合logistic回归89

4.2 logistic回归的推断89

4.2.1 分组或未分组的二分数据89

4.2.2 效应的置信区间90

4.2.3 显著性检验90

4.2.4 概率的置信区间91

4.2.5 为什么使用模型估计概率?91

4.2.6 概率的置信区间:细节91

4.2.7 模型参数估计的标准误92

4.3 属性预测变量的logistic回归93

4.3.1 用指示变量表示属性预测变量93

4.3.2 案例:AZT和AIDS94

4.3.3 因子的ANOVA型模型表示95

4.3.4 2×2×K列联表的Cochran-Mantel-Haenszel检验96

4.3.5 优势比齐次性检验97

4.4 多元logistic回归97

4.4.1 案例:以颜色和宽度作为预测变量的母鲎案例97

4.4.2 通过模型对比确认某项是否必要99

4.4.3 有序预测变量的定量化处理100

4.4.4 容许交互效应101

4.5 logistic回归效应的概括101

4.5.1 基于概率的解释101

4.5.2 标准化解释102

习题103

第5章 logistic回归模型的构建及应用115

5.1 模型选择策略115

5.1.1 运用多少个预测变量?115

5.1.2 案例:再访鲎的数据116

5.1.3 逐步变量选择算法117

5.1.4 案例:鲎数据的向后剔除118

5.1.5 AIC,模型选择及“正确”模型118

5.1.6 概括预测功效:分类表119

5.1.7 概括预测功效:ROC曲线120

5.1.8 概括预测功效:相关121

5.2 模型检验121

5.2.1 模型比较的似然比检验122

5.2.2 拟合优度与偏差122

5.2.3 检验拟合:分组数据,未分组数据及连续预测变量123

5.2.4 logit模型的残差124

5.2.5 案例:佛罗里达大学的研究生入学125

5.2.6 logistic回归的影响诊断126

5.2.7 案例:心脏病与血压的关系127

5.3 稀疏数据效应128

5.3.1 无穷效应估计:定量预测变量128

5.3.2 无穷效应估计:属性预测变量129

5.3.3 案例:带有稀疏数据的临床试验结果130

5.3.4 小样本对X2和G2检验的影响131

5.4 条件logistic回归与精确推断132

5.4.1 条件极大似然推断132

5.4.2 列联表的小样本检验133

5.4.3 案例:晋升能力133

5.4.4 logistic参数和优势比的小样本置信区间134

5.4.5 小样本精确方法的局限性134

5.5 logistic回归的样本量与功效135

5.5.1 比较两个比例所需的样本量135

5.5.2 logistic回归中的样本量136

5.5.3 多重logistic回归中的样本量137

习题137

第6章 多类别logit模型146

6.1 名义响应变量的logit模型146

6.1.1 基线-类别logit146

6.1.2 案例:钝吻鳄食物选择147

6.1.3 估计响应概率149

6.1.4 案例:是否相信来世150

6.1.5 离散选择模型151

6.2 有序响应变量的累积logit模型152

6.2.1 具有比例优势特性的累积logit模型152

6.2.2 案例:政治意识形态与隶属党派的关系154

6.2.3 模型参数的推断155

6.2.4 模型拟合的检验156

6.2.5 案例:对心理健康建模157

6.2.6 比较累积概率的解释158

6.2.7 潜变量诱导159

6.2.8 响应类别选择的不变性160

6.3 成对类别有序logit160

6.3.1 相邻类别logit161

6.3.2 案例:再访政治意识形态161

6.3.3 相继比logit161

6.3.4 案例:发育毒性研究162

6.3.5 聚簇数据中的超散布性163

6.4 条件独立性检验163

6.4.1 案例:工作满意度和收入163

6.4.2 推广的Cochran-Mantel-Haenszel检验165

6.4.3 探测名义-有序条件关联165

6.4.4 探测名义-名义条件关联166

习题166

第7章 列联表的对数线性模型173

7.1 双向表和三向表的对数线性模型173

7.1.1 双向表的独立性对数线性模型174

7.1.2 独立性模型中的参数解释174

7.1.3 双向表的饱和模型175

7.1.4 三向表的对数线性模型177

7.1.5 两因子参数描述条件关联177

7.1.6 案例:酒、香烟、大麻的使用178

7.2 对数线性模型的推断180

7.2.1 卡方拟合优度检验180

7.2.2 对数线性单元残差181

7.2.3 条件关联的检验182

7.2.4 条件优势比的置信区间182

7.2.5 高维对数线性模型183

7.2.6 案例:汽车事故与安全带183

7.2.7 三因子交互作用185

7.2.8 大样本和统计与实践显著性186

7.3 对数线性模型与logistic模型的联系186

7.3.1 利用logistic模型解释对数线性模型187

7.3.2 案例:再访汽车事故数据187

7.3.3 对数线性模型和logistic模型间的对应188

7.3.4 模型选择策略189

7.4 独立图和衰退189

7.4.1 独立图190

7.4.2 三向表的衰退条件190

7.4.3 衰退与logistic模型191

7.4.4 多向表的衰退与独立图192

7.4.5 案例:学生成瘾物质使用的模型构建192

7.4.6 图模型194

7.5 对有序关联建模194

7.5.1 线性—线性关联模型196

7.5.2 案例:性选择197

7.5.3 有序的独立性检验197

习题198

第8章 配对数据的模型209

8.1 比较关联样本的比例210

8.1.1 比较边缘比例的McNemar检验210

8.1.2 比例的差的估计211

8.2 配对的logistic回归212

8.2.1 针对边缘比例的边缘模型212

8.2.2 特定个体表与平均总体表212

8.2.3 配对的条件logistic回归213

8.2.4 匹配案例对照研究的logistic回归214

8.2.5 McNemar与Cochran-Mantel-Haenszel检验的联系216

8.3 比较方形列联表的边缘分布216

8.3.1 边缘齐性与名义分类216

8.3.2 案例:咖啡品牌市场份额217

8.3.3 边缘齐性与有序类别218

8.3.4 案例:为了环保,再利用或少开车?219

8.4 方形表的对称性模型与拟对称性模型219

8.4.1 以logistic模型表示的对称性220

8.4.2 拟对称性220

8.4.3 案例:再访咖啡品牌市场份额220

8.4.4 利用对称性和拟对称性来检验边缘齐性221

8.4.5 有序拟对称性模型221

8.4.6 案例:再利用或少开车?222

8.4.7 利用对称性模型与有序拟对称性模型来检验边缘齐性222

8.5 分析评级者的一致性222

8.5.1 独立性模型的单元残差223

8.5.2 拟独立性模型224

8.5.3 概括一致性的优势比225

8.5.4 拟对称性和一致性建模225

8.5.5 一致性的kappa度量226

8.6 成对偏好的BRADLEY-TERRY模型226

8.6.1 Bradley-Terry模型227

8.6.2 案例:对男子网球选手排序227

习题228

第9章 关联,聚簇响应的建模235

9.1 边缘模型及条件模型236

9.1.1 聚簇二分响应的边缘模型236

9.1.2 案例:抑郁症治疗的纵向研究236

9.1.3 重复响应的条件模型237

9.2 边缘模型:广义估计方程(GEE)方法238

9.2.1 拟似然方法238

9.2.2 广义估计方程方法:基本思想239

9.2.3 二分数据的GEE:抑郁症的研究240

9.2.4 案例:畸胎学中的超散布性241

9.2.5 与ML相比,GEE的局限性242

9.3 GEE的扩展:多项响应242

9.3.1 聚簇多项响应的边缘模型242

9.3.2 案例:关于失眠的研究243

9.3.3 利用GEE对关联性进行建模的另一种方法244

9.3.4 缺失数据的处理244

9.4 给定既往的转移模型245

9.4.1 含有解释变量的转移模型245

9.4.2 案例:呼吸疾病和母亲吸烟245

9.4.3 控制初始响应的比较246

9.4.4 和对数线性模型有关的转移模型247

习题247

第10章 随机效应:广义线性混合模型253

10.1 聚簇属性数据的随机效应建模253

10.1.1 广义线性混合模型253

10.1.2 二分配对的logistic GLMM254

10.1.3 案例:再访对环保的贡献问题255

10.1.4 条件模型与边缘模型的不同效应256

10.2 二分数据的随机效应模型的案例257

10.2.1 二项分布概率的小区域估计257

10.2.2 案例:估计篮球罚球成功率258

10.2.3 案例:再访畸形研究超离散化问题259

10.2.4 案例:相似调查问题的重复响应260

10.2.5 项目反应模型:Rasch模型261

10.2.6 案例:再访抑郁症研究262

10.2.7 边缘模型和条件模型的选择263

10.2.8 条件模型:随机效应与条件ML264

10.3 向多项响应或多个随机效应项的推广264

10.3.1 案例:再访失眠研究264

10.3.2 随机效应与关联异质性265

10.4 多水平(层次)模型267

10.4.1 案例:关于学生进级的两水平模型268

10.4.2 案例:留级268

10.5 GLMM的模型拟合与推断269

10.5.1 拟合GLMM269

10.5.2 模型参数的推断270

习题271

第11章 属性数据分析史漫谈277

11.1 PEARSON-YULE关联性的争议277

11.2 R.A.FISHER的贡献278

11.3 logistic回归279

11.4 多向列联表和对数线性模型280

11.5 最后的一点评论282

附录A:针对属性数据分析的软件283

附录B:卡方分布表293

参考文献294

案例索引296

名词索引299

部分奇数号习题的简要答案306

热门推荐