首页 > 图书中心 >图书详情

R语言

本书课件+代码+大纲已上传:https://pan.baidu.com/s/1BNKZww1h_jj__lhzjKV3Og(百度云盘)大纲+代码请点击“资源下载—课件下载”客服QQ:3306436528 本书分为基础篇、应用篇和进阶篇。注重实践;注重数据变成价值;注重大数据的分析。

作者:刘鹏、张燕、程显毅、刘颖、 朱倩
定价:59.80
印次:1-6
ISBN:9787302494324
出版日期:2019.01.01
印刷日期:2022.06.01

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书力求用简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。 全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则;其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和进阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题,把数据变成价值。进阶篇解决如何用R处理大数据的一些技术。 本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。

more >

随着数据分析的需求不断提升,Excel渐渐无法满足价值挖掘的日常需求,需要更专业化的软件做数据分析。相应的问题就来了,统计学软件那么多,SPSS、R、Python、SAS、JMP、Matlab等,该选哪一个?目前市场上较为火热的软件是R和Python。 开源软件的R能够迅速发展,很大程度上取决于其活跃的社区和各种R包的使用。截至目前(2017年2月25日),CRAN(Comprehensive R Archive Network)上已经有10162个可以获取的R扩展包,内容涉及各行各业,可以适用于各种复杂的统计。 数据科学者的工作就是操纵数据,把原始数据加工成建模需求的形状,而R语言是帮你实现整理数据的最佳的工具。 该书深入浅出地介绍 R 语言在大数据分析应用中的相关知识,全书分为绪论(第1章)、基础篇、应用篇和进阶篇。基础篇(第2~10章)学习如何用 R 完成数据处理,包括数据准备、数据探索、数据变换、数据可视化和数据建模等;应用篇(第11、12章)学习如何用R完成实际的数据分析报告撰写,包括背景与目标、指标设计、描述性分析、模型分析和结论与建议;进阶篇(第13、14章)学习如何使用R提高大数据处理性能,包括RHadoop、SparkR。 绪论从数据、统计学和逻辑学3个方面探讨了树立正确的数据思维的一些原则。数据分析师的数据思维对于整体分析思路,甚至分析结果都有着关键性的作用。普通数据分析师与高级数据分析师的主要差异就是有正确的数据思维观。正确的数据思维观与数据敏感度有关,类似于情商类的看不见,摸不着的东西。简单来说,正确的数据思维观是一种通过数据手段解决问题的思维。 基础篇,讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导入/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle进行试验指导。 应用篇,讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。 进阶篇,解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。 本书特点如下: (1)知识学习的重点是模型的运用而不是模型的原理。第9章既是R语言的重点也是难点,本书利用可视化数据挖掘包Rattle进行试验指导,简化了建模需要具备的数学基础,只要了解相应模型的函数,设置几个参数就可以轻松完成分类与预测、聚类分析、关联规则、智能推荐和时序模式等数据挖掘任务。 (2)注重数据变成价值。数据分析师工作的最重要一环就是写出有情报价值的数据分析报告。直接将分析结果罗列到PPT或Word中,不仅看上去不美观,而且也会影响报告的可读性,使一份数据分析报告成为简单的数据展示。本书通过案例探讨了写出一份具有情报价值的分析报告的技巧。 (3)关注大数据分析。R语言的最大缺点就是处理大数据的性能较低,无法直接处理TB以上的数据,本书进阶篇讨论的两个R包(RHadoop、SparkR)基本上可以处理任何级别的数据。 (4)向读者提供了书中所用的配套代码、数据及PPT,读者可通过上机实验,快速掌握书中所介绍的R语言的使用方法。 本书由程显毅、刘颖和朱倩负责编写。在本书编写过程中,孙丽丽、季国华、赵丽敏、杨琴和章小华等提供了许多参考资料,在此表示由衷的感谢。由于水平有限,书中可能会有不当之处,希望读者多加指教。本书的编写得到刘鹏教授和清华大学出版社王莉编辑的大力支持和悉心指导,在此深表感谢! 编 者 2018年5月

more >
扫描二维码
下载APP了解更多

同系列产品more >

大数据导论技术实训

刘鹏总主编 李四明 刘鹏
定 价:69元

查看详情
人工智能应用开发

刘鹏 总主编 柳贵东
定 价:49元

查看详情
数据挖掘基础(第2版)

刘鹏 陶建辉
定 价:49元

查看详情
数据标注工程(第2版)

李彤、刘鹏
定 价:49元

查看详情
大数据应用部署与调优

刘鹏总主编 刘鹏 李肖俊
定 价:69元

查看详情
图书分类全部图书
more >
  • 李法平- 副教授/系统分析师,硕士,重庆电子工程职业学院软件学院移动应用开发教研室主任,主要从事高职软件类专业教学研究、教育信息化系统和企业信息化系统等应用技术研究。
  • 该书深入浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。                                                                                                                     基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导入/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle进行试验指导。
    应用篇:讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。
    进阶篇:解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。                                                                                         本书注重实践;注重数据变成价值;注重大数据的分析。

more >
  • 第1章  绪论

    1.1  为什么学习R语言 1

    1.1.1  R是什么 1

    1.1.2  R语言主要优势 2

    1.2  正确的数据思维观 4

    1.2.1  数学思维 5

    1.2.2  统计思维 5

    1.2.3  逻辑思维 10

    习题 12

    基础篇

    第2章  R语言入门

    2.1  新手上路 17

    2.1.1  两个例子 17

    2.1.2  R是什么 19

    2.2  R语言开发环境部署 19

    2.2.1  安装R 19

    2.2.2  安装RStudio 20

    2.3  获取帮助 22

    2.3.1  文档和搜索 22

    2.3.2  演示 22

    2.3.3  帮助函数 23

    2.4  工作空间 23

    2.5  脚本 24

    2.6  R包 25

    习题 25

    第3章  数据类型

    3.1  变量与常量 27

    3.1.1  变量 27

    3.1.2  常量 28

    3.2  结构类型 28

    3.2.1  向量 29

    3.2.2  矩阵 31

    3.2.3  数组 33

    3.2.4  数据框 35

    3.2.5  因子 36

    3.2.6  列表 37

    3.3  字符串操作 38

    3.3.1  基本操作 38

    3.3.2  字符串处理stringr包 39

    3.4  用于数据处理和转换的常用函数 40

    习题 41

    第4章  数据准备

    4.1  数据导入 43

    4.1.1  键盘输入数据 44

    4.1.2  导入文本文件 45

    4.1.3  导入Excel数据 46

    4.1.4  导入数据库文件 47

    4.2  数...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘