现代数据科学(R语言·第2版)
通过结合使用统计 和计算方式来解决现实中的数据问题

作者:[美] 本杰明·S.鲍默(Benjamin S. Baumer)、丹尼尔·T.卡普兰(Daniel T. Kaplan)、尼古拉斯·J. 霍顿(Nicholas J. Horton) 著 张小明 郭华 张骞允 译

丛书名:数据科学与大数据技术

定价:128元

印次:1-1

ISBN:9787302598794

出版日期:2022.03.01

印刷日期:2022.03.04

图书责编:王军

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书对上一版做了全面更新,与日益强 大的tidyverse套包保持同步,纳入sf、purrr、 tidymodels和tidytext等包中的新功能。代码的内 容和格式都经过修改,以方便阅读和理解。部分 章节被拆分、重新组织和重新构思,以适应不断 变化的实践环境。

Benjamin S. Baumer是美国史密斯学院统计与数据科学专业的副教授。Benjamin 于2004年成为纽约大都会队第一位全职统计分析师,此后一直担任应用数据科学家。Benjamin曾荣获美国棒球研究学会颁发的2019年Waller教育奖和2016年突出贡献者奖,参与撰写了TheSabermetric Revolution-书。Daniel T. Kaplan是美国玛卡莱斯特学院数学和计算机科学系的名誉教授,是多本统计建模和统计计算教科书的作者。Daniel获 得2006年玛卡莱斯特学院卓越教学奖和2017年终身成就奖。Nicholas J. Horton是美国阿默斯特学院统计和数据科学系的教授,是ASA和AAAS的高级会员,美国国家科学院应用与理论统计委员会的联合主席,多项美国国家教学奖的获得者,一系列统计计算书籍的作者,并积极参与编写数据科学课程,帮助学生“用数据思考"。

前 言 背景和动机 不断增长的数据量和复杂性给分析人员提出了新挑战,他们需要能够对复杂的数据集进行转换来回答重要的统计问题。一份关于本科生数据科学的调查报告[National Academies of Science, Engineering, and Medicine, 2018]指出,数据科学正在彻底改变科学和工作场所。他们将数据科学家定义为“主要从事复杂和海量数据资源分析的知识工作者”。 Michael I. Jordan将数据科学描述为计算思想和推理(统计)思想的结合。如果没有能够整理(wrangle)或维护(marshal)我们周围日益丰富和复杂的数据的技能,分析师将无法使用这些数据做出更好的决策。 对具备这些技能的毕业生的需求非常迫切。根据公司评级网站Glassdoor的报告,2016—2019年间,每年“数据科学家”都是美国薪酬最高的工作[Columbus, 2019]。 新的数据技术使从比以往更多的来源提取数据成为可能。流线型的数据处理库使数据科学家能够表达如何将这些数据重组为适合分析的形式。数据库系统能使存储和检索越来越多的数据成为可能。最先进的工作流工具有助于形成良好的文档和可再现的分析。现代统计和机器学习方法允许分析者拟合和评估模型,并进行有监督或无监督的学习以提取现实中内在的信息。现代数据科学需要将统计、计算、数据以及通信技能进行紧密结合。 目标受众 《现代数据科学(R语言·第2版)》是为那些想要学习适当技能来处理复杂数据科学项目和“用数据思考”(由谷歌的Diane Lambert 创造)的读者而写的。使用数据解决问题的愿...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

 

第Ⅰ部分  数据科学简介

第1章  序言:为什么有数据科学?   2

1.1 数据科学是什么   3

1.2 案例学习:棒球资料统计分析

的演变   5

1.3 数据集   6

1.4  扩展资源   7

第2章  数据可视化   8

2.1  2012年联邦大选周期   8

2.1.1  这两组数据有区别吗?   10

2.1.2  图形变化   11

2.1.3  检查变量之间的关系   12

2.1.4  网络   14

2.2  组成数据图形   15

2.2.1  数据图形分类   15

2.2.2  颜色   17

2.2.3  剖析数据图形   19

2.3  数据图形的重要性:

挑战者号   21

2.4  创建有效的演示   25

2.5  更广阔的数据可视化世界   25

2.6  扩展资源   27

2.7  练习题   28

2.8  附加练习   29

第3章  图形语法   30

3.1  数据图形语法   30

3.1.1  画面   31

3.1.2  刻度   33

3.1.3  指南   35

3.1.4  方面   35

3.1.5  层次   36

3.2  R中的规范数据图形   38

3.2.1  单变量显示   38

3.2.2  多元显示   40

3.2.3  地图   46

3.2.4  网络   46

3.3  扩展示例:历史婴儿名字   47

3.3.1  至今仍活着的人口的

百分比   48

3.3.2  最普...

《现代数据科学(R语言●第2版)》是面向本
科生的综合性数据科学教材,通过结合使用统计
和计算方式来解决现实中的数据问题。本书不
仅专注于案例或编程语法,还讲述如何利用**
R/RStudio计算环境中的统计编程,从各种数据中
提取有意义的信息,进而解决重大问题。