资料下载网
首页 计算机 考试教辅
R语言实战_Rober I Kabocoff著_高涛译 pdf电子书免费下载
首页 > 计算机 > AI人工智能 > R语言实战_Rober I Kabocoff著_高涛译 pdf电子书免费下载

《R语言实战_Rober I Kabocoff著_高涛译》pdf电子书免费下载


下载方式一:

百度网盘下载地址:https://pan.baidu.com/s/1yV_-yXYGt0uCOk0HqbS8cw
百度网盘密码:1111

下载方式二:

http://ziliaoshare.cn/Download/ab_123515_pd_RYYSZ_RoberIKabocoffZ_GTY.zip

 


R语言实战_Rober I Kabocoff著_高涛译

作者:Robert I. Kabacoff,高涛,肖楠,陈钢

页数:412

出版社:人民邮电出版社

《R语言实战_Rober I Kabocoff著_高涛译》介绍

本书的目的是让读者熟悉R平台,重点关注那些能马上应用到数据操作、可视化和理解的方 法。全书共16章,分为4部分:“入门”、“基础方法”、“中级方法”和“高级方法”。在8个附录中 还有更多的相关内容。 第1章首先简要介绍了R,以及它作为数据分析平台的诸多特性。这一章主要介绍了R的获取, 以及如何用网上的扩展包增强R基本安装的功能。另外,它还介绍了用户界面,以及如何以交互 方式和批处理方式运行程序。 第2章介绍了向R中导入数据的诸多方法。这一章的前半部分介绍了R用来存储数据的数据结 构,以及如何用键盘输入数据。后半部分介绍了怎样从文本文件、网页、电子表格、统计软件和 数据库向R导入数据。 很多用户最初接触R都是为了绘制图形,我们在第3章会对此作介绍。这一章介绍了创建、修 改图形的方法,以及如何将图形保存为各种格式的文件。 第4章探讨了基本的数据管理,包括数据集的排序、合并、取子集,以及变量的转换、重编 码和删除。 在第4章的基础上,第5章涵盖了数据管理中函数(数学函数、统计函数、字符函数)和控制 结构(循环、条件执行)的用法。然后我们介绍如何编写自己的R函数,以及如何用不同的方法 整合数据。 第6章演示了创建常见单变量图形的方法,例如柱状图、饼图、直方图、密度图、箱线图和 点图。这些图形对于理解单变量的分布都很有用。 第7章首先演示了如何总结数据,包括使用描述统计量和交叉表。然后,这一章介绍了用于 分析两变量间关系的基本方法,包括相关性、t检验、卡方检验和非参数方法。 第8章介绍了针对一个数值型结果变量与一系列数值型预测变量间的关系进行建模的回归方 法,详细给出了拟合模型的方法、适用性评价和含义解释。 第9章介绍了基于方差及其变体对基本实验设计的分析。此处,我们通常感兴趣的是处理方 式的组合或条件对数值结果变量的影响。这一章还介绍了如何评价分析的适用性,以及如何可视 化地展示分析结果。 第10章详细介绍了功效分析。这一章首先讨论了假设检验,重点是如何判断在给定置信度的 前提下需要多少样本才能判断处理的效果。这可以帮助我们安排实验和准实验研究来获得有用的 结果。 第11章扩展了第5章的内容,介绍了创建表现两个或多个变量间关系的图形。这包括各种2D 和3D的散点图、散点图矩阵、折线图、相关图和马赛克图。 第12章介绍了一些稳健的数据分析方法,它们能处理比较复杂的情况,比如数据来源于未知 或混合分布、有小样本问题、有恼人的异常值,或者依据理论分布设计假设检验非常复杂且在数 学上难以处理的情况。这一章介绍的方法包括重抽样和自助法——很容易在R中实现的需要大量 计算机资源的方法。 图灵社区会员 matrixvirus(matrixvirus@163.com) 专享 尊重版权 XII 关于本书 第13章扩展了第8章中介绍的回归方法,分析非正态分布的数据。这一章首先介绍了广义线 性模型,然后重点介绍了如何预测类别型变量(Logistic回归)或计数变量(泊松回归)。 多元数据分析的一个难点是简化数据。第14章介绍了如何将大量的相关变量转换成较少的不 相关变量(主成分分析),以及如何发现一系列变量中的潜在结构(因子分析)。这些方法涉及许 多步骤,每一步都有详细的介绍。 实际工作中面临的一个普遍问题是数据值缺失,第15章介绍了一个应对此问题的现代方法。 R中有很多简捷的方法可以用来分析因各种原因导致缺失而生成的不完整数据。这一章对一些好 的方法都有介绍,还具体说明了在什么情况下应该用哪一种以及应该避免使用哪些方法。 第16章介绍了R中最先进、最有用的数据可视化方法,包括用lattice图形表现非常复杂的数据, 简要介绍新的ggplot2包,并对各种跟图形实时交互的方法做了综述。 后记中介绍了一些优秀的网站,有助于读者进一步学习R、加入R社区、获得帮助,并及时 获得R这个快速发展的软件的最新信息。 最后的内容也很重要,8个附录(从A到H)扩展了正文的一些内容,包括R中的图形用户界 面、自定义和升级R、导出数据到其他软件、创建出版级质量的输出、(像MATLAB一样)用R做 矩阵计算,以及处理大型数据集。 例子 为了让本书内容尽可能接近各个领域的实际情况,我从心理学、社会学、医学、生物、商业 和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。 这些例子中所使用的数据集是经过精心挑选的,因为它们不仅提出了有趣的问题,而且比 较小。这样能让读者专注于技术,快速地理解所涉及的过程。在学习新方法时,数据集小是有好 处的。 这些数据集有些是R基本安装中就有的,有些则可以通过网上下载软件包来获得。每个例子 的代码都可以从www.manning.com/RinAction①下载。为了更好地理解本书中的内容,我建议读者 在阅读本书时试试这些例子。 经常听人引用这么一句话:如果你问两个统计学家该如何分析一个数据集,你会得到三个答 案。反过来说,每个答案都能让你更好地理解数据集。对于一个问题,我不会说某种分析方式是 最好的,或者是唯一的。读者应该用本书中学到的技术动手分析数据,看看都能得到什么。R是 交互式的,最好的学习方法就是自己尝试。 排版约定 下面是本书的排版约定。  等宽字体用于代码清单。 —————————— ① 也可在图灵社区(www.ituring.com.cn)本书网页免费注册下载。——编者注 图灵社区会员 matrixvirus(matrixvirus@163.com) 专享 尊重版权 关于本书 XIII 1 2 3 4 5 10 6 7 8 9  等宽字体还用于在一般的正文中表示代码或之前定义的对象。  代码清单中的斜体表示占位符。你应该用自己问题中的文本和值来替换它们。例如, path_to_my_file就应该用该文件在你自己电脑上的实际路径来替换。  R是一种交互式语言,用提示符(默认是>)表示已经准备好读取用户的下一行输入。本 书中的很多代码清单都是从交互式会话中截取的。当你看到代码是以>开头时,不要输入 这个提示符。  用行内注释作为代码注释(这是Manning图书的传统做法)。此外,有些注释会以有序项 目符号的形式出现(如),它们对应稍后正文中对代码作出的解释。  为了节约版面,让正文更紧凑,我们会在交互式会话的输出中加入一些空白,同时也会 删除一些与当前讨论问题无关的文字。 作者在线 在购买本书英文版的同时,你便获得了访问Manning出版社运营的私密Web论坛的权限,在 这里你可以发表图书评论、询问技术问题,还可以从作者或其他读者那里获得帮助。用浏览器访 问www.manning.com/RinAction就可以访问和订阅这个论坛。这个网页说明了注册后如何访问论 坛、能获得何种帮助以及论坛上的行为规范等信息。 Manning致力于为读者之间以及读者和作者之间提供一个良好的交流空间。作者对论坛的参 与完全是自愿的,他们对AO论坛的贡献都是(无偿的)志愿行为。我们建议读者向作者提一些 有挑战性的问题,作者对这样的问题会更有兴趣。 在本书英文版的整个销售期中,大家都可以从出版商的网站上访问AO论坛,阅读以前的 讨论。


《R语言实战_Rober I Kabocoff著_高涛译》目录

第一部分 入 门

第1 章 R 语言介绍3

1.1 为何要使用R?.4

1.2 R 的获取和安装.6

1.3 R 的使用7

1.3.1 新手上路7

1.3.2 获取帮助10

1.3.3 工作空间10

1.3.4 输入和输出12

1.4 包.14

1.4.1 什么是包14

1.4.2 包的安装14

1.4.3 包的载入14

1.4.4 包的使用方法.15

1.5 批处理15

1.6 将输出用为输入——结果的重用16

1.7 处理大数据集16

1.8 示例实践17

1.9 小结.18

第2 章 创建数据集19

2.1 数据集的概念19

2.2 数据结构20

2.2.1 向量21

2.2.2 矩阵22

2.2.3 数组23

2.2.4 数据框24

2.2.5 因子27

2.2.6 列表29

2.3 数据的输入30

2.3.1 使用键盘输入数据.31

2.3.2 从带分隔符的文本文件导入

数据32

2.3.3 导入Excel 数据.33

2.3.4 导入XML 数据34

2.3.5 从网页抓取数据.34

2.3.6 导入SPSS 数据34

2.3.7 导入SAS 数据.34

2.3.8 导入Stata 数据35

2.3.9 导入netCDF 数据35

2.3.10 导入HDF5 数据.35

2.3.11 访问数据库管理系统.36

2.3.12 通过Stat/Transfer 导入数据37

2.4 数据集的标注37

2.4.1 变量标签38

2.4.2 值标签38

2.5 处理数据对象的实用函数.38

2.6 小结.39

第3 章 图形初阶40

3.1 使用图形40

3.2 一个简单的例子42

3.3 图形参数43

3.3.1 符号和线条45

3.3.2 颜色46

3.3.3 文本属性47

3.3.4 图形尺寸与边界尺寸.49

3.4 添加文本、自定义坐标轴和图例.50

3.4.1 标题51

3.4.2 坐标轴52

3.4.3 参考线54

图灵社区会员 matrixvirus(matrixvirus@163.com) 专享 尊重版权

XVI 目 录

3.4.4 图例54

3.4.5 文本标注56

3.5 图形的组合58

3.6 小结.64

第4 章 基本数据管理.65

4.1 一个示例.65

4.2 创建新变量67

4.3 变量的重编码68

4.4 变量的重命名69

4.5 缺失值.70

4.5.1 重编码某些值为缺失值.71

4.5.2 在分析中排除缺失值.72

4.6 日期值.73

4.6.1 将日期转换为字符型变量.74

4.6.2 更进一步74

4.7 类型转换.74

4.8 数据排序.75

4.9 数据集的合并76

4.9.1 添加列76

4.9.2 添加行76

4.10 数据集取子集77

4.10.1 选入(保留)变量77

4.10.2 剔除(丢弃)变量77

4.10.3 选入观测78

4.10.4 subset()函数79

4.10.5 随机抽样79

4.11 使用SQL 语句操作数据框.80

4.12 小结.81

第5 章 高级数据管理.82

5.1 一个数据处理难题82

5.2 数值和字符处理函数83

5.2.1 数学函数83

5.2.2 统计函数84

5.2.3 概率函数86

5.2.4 字符处理函数89

5.2.5 其他实用函数90

5.2.6 将函数应用于矩阵和数据框.91

5.3 数据处理难题的一套解决方案.93

5.4 控制流. 96

5.4.1 重复和循环 97

5.4.2 条件执行 97

5.5 用户自编函数 99

5.6 整合与重构. 101

5.6.1 转置. 101

5.6.2 整合数据 101

5.6.3 reshape 包. 102

5.7 小结. 105

第二部分 基本方法

第6 章 基本图形. 108

6.1 条形图. 108

6.1.1 简单的条形图 109

6.1.2 堆砌条形图和分组条形图. 110

6.1.3 均值条形图 111

6.1.4 条形图的微调 112

6.1.5 棘状图 113

6.2 饼图. 114

6.3 直方图. 116

6.4 核密度图. 118

6.5 箱线图. 120

6.5.1 使用并列箱线图进行跨组

比较. 121

6.5.2 小提琴图 124

6.6 点图. 125

6.7 小结. 128

第7 章 基本统计分析. 129

7.1 描述性统计分析 130

7.1.1 方法云集 130

7.1.2 分组计算描述性统计量. 133

7.1.3 结果的可视化 136

7.2 频数表和列联表 136

7.2.1 生成频数表 137

7.2.2 独立性检验 142

7.2.3 相关性的度量 144

7.2.4 结果的可视化 144

7.2.5 将表转换为扁平格式.144

7.3 相关.146

7.3.1 相关的类型146

7.3.2 相关性的显著性检验.148

7.3.3 相关关系的可视化.150

7.4 t 检验150

7.4.1 独立样本的t 检验150

7.4.2 非独立样本的t 检验151

7.4.3 多于两组的情况.152

7.5 组间差异的非参数检验.152

7.5.1 两组的比较152

7.5.2 多于两组的比较.153

7.6 组间差异的可视化155

7.7 小结.155

第三部分 中级方法

第8 章 回归158

8.1 回归的多面性159

8.1.1 OLS 回归的适用情境.159

8.1.2 基础回顾160

8.2 OLS 回归.160

8.2.1 用lm()拟合回归模型.161

8.2.2 简单线性回归.162

8.2.3 多项式回归164

8.2.4 多元线性回归.167

8.2.5 有交互项的多元线性回归169

8.3 回归诊断171

8.3.1 标准方法171

8.3.2 改进的方法175

8.3.3 线性模型假设的综合验证180

8.3.4 多重共线性181

8.4 异常观测值181

8.4.1 离群点182

8.4.2 高杠杆值点182

8.4.3 强影响点183

8.5 改进措施186

8.5.1 删除观测点186

8.5.2 变量变换186

8.5.3 增删变量187

8.5.4 尝试其他方法188

8.6 选择“最佳”的回归模型.188

8.6.1 模型比较188

8.6.2 变量选择189

8.7 深层次分析193

8.7.1 交叉验证193

8.7.2 相对重要性194

8.8 小结.197

第9 章 方差分析198

9.1 术语速成198

9.2 ANOVA 模型拟合.201

9.2.1 aov()函数.201

9.2.2 表达式中各项的顺序.201

9.3 单因素方差分析202

9.3.1 多重比较204

9.3.2 评估检验的假设条件.206

9.4 单因素协方差分析208

9.4.1 评估检验的假设条件.209

9.4.2 结果可视化210

9.5 双因素方差分析211

9.6 重复测量方差分析214

9.7 多元方差分析216

9.7.1 评估假设检验217

9.7.2 稳健多元方差分析.219

9.8 用回归来做ANOVA.219

9.9 小结.221

第10 章 功效分析.222

10.1 假设检验速览222

10.2 用pwr 包做功效分析225

10.2.1 t 检验225

10.2.2 方差分析227

10.2.3 相关性227

10.2.4 线性模型228

10.2.5 比例检验229

10.2.6 卡方检验229

10.2.7 在新情况中选择合适的

效应值230

10.3 绘制功效分析图形232

图灵社区会员 matrixvirus(matrixvirus@163.com) 专享 尊重版权

XVIII 目 录

10.4 其他软件包234

10.5 小结.235

第11 章 中级绘图236

11.1 散点图.237

11.1.1 散点图矩阵239

11.1.2 高密度散点图244

11.1.3 三维散点图247

11.1.4 气泡图250

11.2 折线图.252

11.3 相关图.255

11.4 马赛克图259

11.5 小结.261

第12 章 重抽样与自助法.263

12.1 置换检验263

12.2 用coin 包做置换检验265

12.2.1 独立两样本和K 样本检验.266

12.2.2 列联表中的独立性.267

12.2.3 数值变量间的独立性.268

12.2.4 两样本和K 样本相关性

检验268

12.2.5 深入探究269

12.3 lmPerm 包的置换检验.269

12.3.1 简单回归和多项式回归.269

12.3.2 多元回归271

12.3.3 单因素方差分析和协方

差分析271

12.3.4 双因素方差分析.272

12.4 置换检验点评273

12.5 自助法.273

12.6 boot 包中的自助法274

12.6.1 对单个统计量使用自助法.275

12.6.2 多个统计量的自助法.277

12.7 小结.279

第四部分 高级方法

第13 章 广义线性模型.282

13.1 广义线性模型和glm()函数.282

13.1.1 glm()函数. 283

13.1.2 连用的函数 284

13.1.3 模型拟合和回归诊断. 285

13.2 Logistic 回归. 285

13.2.1 解释模型参数 288

13.2.2 评价预测变量对结果概率

的影响 289

13.2.3 过度离势 290

13.2.4 扩展 291

13.3 泊松回归. 291

13.3.1 解释模型参数 293

13.3.2 过度离势 294

13.3.3 扩展 295

13.4 小结. 297

第14 章 主成分和因子分析 298

14.1 R 中的主成分和因子分析. 299

14.2 主成分分析 300

14.2.1 判断主成分的个数. 300

14.2.2 提取主成分 302

14.2.3 主成分旋转 305

14.2.4 获取主成分得分 306

14.3 探索性因子分析 307

14.3.1 判断需提取的公共因子数. 308

14.3.2 提取公共因子 309

14.3.3 因子旋转 310

14.3.4 因子得分 313

14.3.5 其他与EFA 相关的包. 313

14.4 其他潜变量模型 314

14.5 小结. 314

第15 章 处理缺失数据的高级方法. 316

15.1 处理缺失值的步骤 317

15.2 识别缺失值 318

15.3 探索缺失值模式 319

15.3.1 列表显示缺失值 319

15.3.2 图形探究缺失数据. 320

15.3.3 用相关性探索缺失值. 322

15.4 理解缺失数据的来由和影响. 324

15.5 理性处理不完整数据 325

15.6 完整实例分析(行删除) .326

15.7 多重插补327

15.8 处理缺失值的其他方法.331

15.8.1 成对删除331

15.8.2 简单(非随机)插补.332

15.9 小结.332

第16 章 高级图形进阶.333

16.1 R 中的四种图形系统.333

16.2 lattice 包.334

16.2.1 条件变量338

16.2.2 面板函数339

16.2.3 分组变量342

16.2.4 图形参数345

16.2.5 页面摆放346

16.3 ggplot2 包.347

16.4 交互式图形351

16.4.1 与图形交互:鉴别点.351

16.4.2 playwith 352

16.4.3 latticist353

16.4.4 iplots 包的交互图形354

16.4.5 rggobi 355

16.5 小结.356

后记:探索R 的世界.357

附录A 图形用户界面359

附录B 自定义启动环境.362

附录C 从R 中导出数据364

附录D 制作出版级品质的输出.366

附录E R 中的矩阵运算374

附录F 本书中用到的扩展包.376

附录G 处理大数据.381

附录H 更新R 383

参考文献.385

计算机


python
AI人工智能
javascript
计算机网络/服务器
数据库技术
计算机F

考试教辅


考研考博
英语四六级

沪ICP备18046276号-5