图书介绍

属性数据分析引论PDF|Epub|txt|kindle电子书版本网盘下载

Alan Agresti著著
出版社：北京：高等教育出版社
ISBN：9787040247510
出版时间：2008
标注页数：318页
文件大小：160MB
文件页数：338页
主题词：社会调查－统计分析－统计程序

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：f8a49355e8af670066a0ba2971105abb

下载说明

属性数据分析引论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章导言1

1.1 属性响应数据1

1.1.1 响应变量和解释变量的区别2

1.1.2 名义量表和有序量表的区别2

1.1.3 本书的结构3

1.2 属性数据的概率分布3

1.2.1 二项分布3

1.2.2 多项分布5

1.3 比例的统计推断5

1.3.1 似然函数和极大似然估计5

1.3.2 二项比例的显著性检验7

1.3.3 案例：关于堕胎合法化的调查结果7

1.3.4 二项比例的置信区间8

1.4 关于离散数据的更多统计推断9

1.4.1 Wald，似然比和得分推断9

1.4.2 二项参数的Wald，得分和似然比推断11

1.4.3 小样本二项推断11

1.4.4 小样本离散数据推断的保守性12

1.4.5 基于中间P-值的推断13

1.4.6 小结13

习题14

第2章列联表18

2.1 列联表的概率结构18

2.1.1 联合概率，边缘概率以及条件概率19

2.1.2 案例：关于来世19

2.1.3 诊断检验的敏感度和特异度20

2.1.4 独立性21

2.1.5 二项抽样和多项抽样21

2.2 2×2表比例的比较22

2.2.1 比例差22

2.2.2 案例：阿司匹林与心脏病22

2.2.3 相对风险23

2.3 优势比24

2.3.1 优势比的性质24

2.3.2 案例：阿司匹林和心脏病案例中的优势比25

2.3.3 优势比和对数优势比的推断25

2.3.4 优势比和相对风险的联系27

2.3.5 案例对照研究中优势比的应用27

2.3.6 观测研究的种类28

2.4 独立性的卡方检验29

2.4.1 皮尔逊统计量和卡方分布29

2.4.2 似然比统计量30

2.4.3 独立性检验31

2.4.4 案例：政党认同中的性别差异31

2.4.5 列联表的单元残差32

2.4.6 卡方统计量的分解33

2.4.7 卡方检验的小结34

2.5 有序数据的独立性检验34

2.5.1 线性趋势与独立性35

2.5.2 案例：饮酒与婴儿畸形35

2.5.3 有序检验的特殊功效36

2.5.4 得分的选择37

2.5.5 I×2表和2×J表趋势的检验38

2.5.6 名义变量—有序变量列联表38

2.6 小样本的精确推断38

2.6.1 2×2表的费希尔精确检验38

2.6.2 案例：费希尔的品茶者试验39

2.6.3 P-值和真实P-值的保守性（第I类错误）40

2.6.4 优势比的小样本置信区间41

2.7 三向列联表的关联性41

2.7.1 部分表42

2.7.2 条件关联与边缘关联：死刑判决的案例42

2.7.3 辛普森悖论43

2.7.4 条件优势比和边缘优势比44

2.7.5 条件独立和边缘独立45

2.7.6 齐次关联性46

习题46

第3章广义线性模型55

3.1 广义线性模型的构成部分55

3.1.1 随机部分56

3.1.2 系统部分56

3.1.3 联系函数56

3.1.4 正态GLM57

3.2 二分数据的广义线性模型57

3.2.1 线性概率模型58

3.2.2 案例：打鼾与心脏病58

3.2.3 logistic回归模型59

3.2.4 probit回归模型61

3.2.5 二分回归和累积分布函数61

3.3 计数数据的广义线性模型62

3.3.1 泊松回归63

3.3.2 案例：母鲎及其追随者64

3.3.3 超散布性：超出预期的变异性67

3.3.4 负二项分布68

3.3.5 比率数据的计数回归69

3.3.6 案例：英国的火车事故69

3.4 统计推断和模型检验70

3.4.1 关于模型参数的推断70

3.4.2 案例：再访打鼾与心脏病的案例71

3.4.3 偏差71

3.4.4 基于偏差的模型比较72

3.4.5 比较观测和模型拟合的残差72

3.5 广义线性模型的拟合73

3.5.1 GLM拟合的Newton-Raphson算法73

3.5.2 依赖于似然函数的Wald，似然比以及得分推断74

3.5.3 GLM的优势75

习题75

第4章 logistic回归83

4.1 logistic回归模型的解释83

4.1.1 线性近似解释84

4.1.2 母鲎：观察并平滑二分结果85

4.1.3 鲎：logistic回归拟合的解释86

4.1.4 优势比解释88

4.1.5 回顾性研究中的logistic回归88

4.1.6 X服从正态分布意味着Y适合logistic回归89

4.2 logistic回归的推断89

4.2.1 分组或未分组的二分数据89

4.2.2 效应的置信区间90

4.2.3 显著性检验90

4.2.4 概率的置信区间91

4.2.5 为什么使用模型估计概率？91

4.2.6 概率的置信区间：细节91

4.2.7 模型参数估计的标准误92

4.3 属性预测变量的logistic回归93

4.3.1 用指示变量表示属性预测变量93

4.3.2 案例：AZT和AIDS94

4.3.3 因子的ANOVA型模型表示95

4.3.4 2×2×K列联表的Cochran-Mantel-Haenszel检验96

4.3.5 优势比齐次性检验97

4.4 多元logistic回归97

4.4.1 案例：以颜色和宽度作为预测变量的母鲎案例97

4.4.2 通过模型对比确认某项是否必要99

4.4.3 有序预测变量的定量化处理100

4.4.4 容许交互效应101

4.5 logistic回归效应的概括101

4.5.1 基于概率的解释101

4.5.2 标准化解释102

习题103

第5章 logistic回归模型的构建及应用115

5.1 模型选择策略115

5.1.1 运用多少个预测变量？115

5.1.2 案例：再访鲎的数据116

5.1.3 逐步变量选择算法117

5.1.4 案例：鲎数据的向后剔除118

5.1.5 AIC，模型选择及“正确”模型118

5.1.6 概括预测功效：分类表119

5.1.7 概括预测功效：ROC曲线120

5.1.8 概括预测功效：相关121

5.2 模型检验121

5.2.1 模型比较的似然比检验122

5.2.2 拟合优度与偏差122

5.2.3 检验拟合：分组数据，未分组数据及连续预测变量123

5.2.4 logit模型的残差124

5.2.5 案例：佛罗里达大学的研究生入学125

5.2.6 logistic回归的影响诊断126

5.2.7 案例：心脏病与血压的关系127

5.3 稀疏数据效应128

5.3.1 无穷效应估计：定量预测变量128

5.3.2 无穷效应估计：属性预测变量129

5.3.3 案例：带有稀疏数据的临床试验结果130

5.3.4 小样本对X2和G2检验的影响131

5.4 条件logistic回归与精确推断132

5.4.1 条件极大似然推断132

5.4.2 列联表的小样本检验133

5.4.3 案例：晋升能力133

5.4.4 logistic参数和优势比的小样本置信区间134

5.4.5 小样本精确方法的局限性134

5.5 logistic回归的样本量与功效135

5.5.1 比较两个比例所需的样本量135

5.5.2 logistic回归中的样本量136

5.5.3 多重logistic回归中的样本量137

习题137

第6章多类别logit模型146

6.1 名义响应变量的logit模型146

6.1.1 基线-类别logit146

6.1.2 案例：钝吻鳄食物选择147

6.1.3 估计响应概率149

6.1.4 案例：是否相信来世150

6.1.5 离散选择模型151

6.2 有序响应变量的累积logit模型152

6.2.1 具有比例优势特性的累积logit模型152

6.2.2 案例：政治意识形态与隶属党派的关系154

6.2.3 模型参数的推断155

6.2.4 模型拟合的检验156

6.2.5 案例：对心理健康建模157

6.2.6 比较累积概率的解释158

6.2.7 潜变量诱导159

6.2.8 响应类别选择的不变性160

6.3 成对类别有序logit160

6.3.1 相邻类别logit161

6.3.2 案例：再访政治意识形态161

6.3.3 相继比logit161

6.3.4 案例：发育毒性研究162

6.3.5 聚簇数据中的超散布性163

6.4 条件独立性检验163

6.4.1 案例：工作满意度和收入163

6.4.2 推广的Cochran-Mantel-Haenszel检验165

6.4.3 探测名义-有序条件关联165

6.4.4 探测名义-名义条件关联166

习题166

第7章列联表的对数线性模型173

7.1 双向表和三向表的对数线性模型173

7.1.1 双向表的独立性对数线性模型174

7.1.2 独立性模型中的参数解释174

7.1.3 双向表的饱和模型175

7.1.4 三向表的对数线性模型177

7.1.5 两因子参数描述条件关联177

7.1.6 案例：酒、香烟、大麻的使用178

7.2 对数线性模型的推断180

7.2.1 卡方拟合优度检验180

7.2.2 对数线性单元残差181

7.2.3 条件关联的检验182

7.2.4 条件优势比的置信区间182

7.2.5 高维对数线性模型183

7.2.6 案例：汽车事故与安全带183

7.2.7 三因子交互作用185

7.2.8 大样本和统计与实践显著性186

7.3 对数线性模型与logistic模型的联系186

7.3.1 利用logistic模型解释对数线性模型187

7.3.2 案例：再访汽车事故数据187

7.3.3 对数线性模型和logistic模型间的对应188

7.3.4 模型选择策略189

7.4 独立图和衰退189

7.4.1 独立图190

7.4.2 三向表的衰退条件190

7.4.3 衰退与logistic模型191

7.4.4 多向表的衰退与独立图192

7.4.5 案例：学生成瘾物质使用的模型构建192

7.4.6 图模型194

7.5 对有序关联建模194

7.5.1 线性—线性关联模型196

7.5.2 案例：性选择197

7.5.3 有序的独立性检验197

习题198

第8章配对数据的模型209

8.1 比较关联样本的比例210

8.1.1 比较边缘比例的McNemar检验210

8.1.2 比例的差的估计211

8.2 配对的logistic回归212

8.2.1 针对边缘比例的边缘模型212

8.2.2 特定个体表与平均总体表212

8.2.3 配对的条件logistic回归213

8.2.4 匹配案例对照研究的logistic回归214

8.2.5 McNemar与Cochran-Mantel-Haenszel检验的联系216

8.3 比较方形列联表的边缘分布216

8.3.1 边缘齐性与名义分类216

8.3.2 案例：咖啡品牌市场份额217

8.3.3 边缘齐性与有序类别218

8.3.4 案例：为了环保，再利用或少开车？219

8.4 方形表的对称性模型与拟对称性模型219

8.4.1 以logistic模型表示的对称性220

8.4.2 拟对称性220

8.4.3 案例：再访咖啡品牌市场份额220

8.4.4 利用对称性和拟对称性来检验边缘齐性221

8.4.5 有序拟对称性模型221

8.4.6 案例：再利用或少开车？222

8.4.7 利用对称性模型与有序拟对称性模型来检验边缘齐性222

8.5 分析评级者的一致性222

8.5.1 独立性模型的单元残差223

8.5.2 拟独立性模型224

8.5.3 概括一致性的优势比225

8.5.4 拟对称性和一致性建模225

8.5.5 一致性的kappa度量226

8.6 成对偏好的BRADLEY-TERRY模型226

8.6.1 Bradley-Terry模型227

8.6.2 案例：对男子网球选手排序227

习题228

第9章关联，聚簇响应的建模235

9.1 边缘模型及条件模型236

9.1.1 聚簇二分响应的边缘模型236

9.1.2 案例：抑郁症治疗的纵向研究236

9.1.3 重复响应的条件模型237

9.2 边缘模型：广义估计方程（GEE）方法238

9.2.1 拟似然方法238

9.2.2 广义估计方程方法：基本思想239

9.2.3 二分数据的GEE：抑郁症的研究240

9.2.4 案例：畸胎学中的超散布性241

9.2.5 与ML相比，GEE的局限性242

9.3 GEE的扩展：多项响应242

9.3.1 聚簇多项响应的边缘模型242

9.3.2 案例：关于失眠的研究243

9.3.3 利用GEE对关联性进行建模的另一种方法244

9.3.4 缺失数据的处理244

9.4 给定既往的转移模型245

9.4.1 含有解释变量的转移模型245

9.4.2 案例：呼吸疾病和母亲吸烟245

9.4.3 控制初始响应的比较246

9.4.4 和对数线性模型有关的转移模型247

习题247

第10章随机效应：广义线性混合模型253

10.1 聚簇属性数据的随机效应建模253

10.1.1 广义线性混合模型253

10.1.2 二分配对的logistic GLMM254

10.1.3 案例：再访对环保的贡献问题255

10.1.4 条件模型与边缘模型的不同效应256

10.2 二分数据的随机效应模型的案例257

10.2.1 二项分布概率的小区域估计257

10.2.2 案例：估计篮球罚球成功率258

10.2.3 案例：再访畸形研究超离散化问题259

10.2.4 案例：相似调查问题的重复响应260

10.2.5 项目反应模型：Rasch模型261

10.2.6 案例：再访抑郁症研究262

10.2.7 边缘模型和条件模型的选择263

10.2.8 条件模型：随机效应与条件ML264

10.3 向多项响应或多个随机效应项的推广264

10.3.1 案例：再访失眠研究264

10.3.2 随机效应与关联异质性265

10.4 多水平（层次）模型267

10.4.1 案例：关于学生进级的两水平模型268

10.4.2 案例：留级268

10.5 GLMM的模型拟合与推断269

10.5.1 拟合GLMM269

10.5.2 模型参数的推断270

习题271

第11章属性数据分析史漫谈277

11.1 PEARSON-YULE关联性的争议277

11.2 R.A.FISHER的贡献278

11.3 logistic回归279

11.4 多向列联表和对数线性模型280

11.5 最后的一点评论282

附录A：针对属性数据分析的软件283

附录B：卡方分布表293

参考文献294

案例索引296

名词索引299

部分奇数号习题的简要答案306