R语言数据处理及可视化分析
"揭秘tidyverse核心包数据处理能力 ,介绍ggplot2及其实用增强包可视化案例 "

作者:杨德春

丛书名:计算机技术开发与应用丛书

定价:59元

印次:1-1

ISBN:9787302641728

出版日期:2023.11.01

印刷日期:2023.11.10

图书责编:赵佳霓

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书以R语言常见数据处理方法、ggplot2可视化为主线,希望解决大多数R学习者在学习过程中碰到的难点。本书以实战为目的,聚焦R语言本身数据处理、可视化特点,以一个个例子循序渐进的讲述R语言数据处理及可视化中用到的经典软件包。以便读者能快速将所学内容运用到在实际场景中。 本书共6章,第1~3章分别介绍R语言及其软件安装、数据可视化入门介绍、数据存储结构及数据处理方法;第4章和第5章分别介绍ggplot2可视技巧、常见ggplot2增强包使用方法;第6章数据可视化分析示例,对数据处理及可视化技巧综合运用作了介绍;附录A简要介绍rmarkdown及大数据处理神器data.table包。 本书侧重数据处理及可视化在日常工作学习中的运用,以降低读者学习曲线。本书为R语言的入门书,也可以作为在财务分析、经营分析、商业分析、数据分析等有一定经验读者的参考图书。

杨德春,毕业于山西财经大学财务管理专业。长期参与企业信息化、数据流治理工作,从事过财务分析、经营分析、市场分析、数据挖掘等数据分析相关领域岗位工作。服务过多家大型企业,如家乐福、沃尔玛、顺丰等。熟悉R语言、数据库、Python等数据处理工具及方法的实际运用,近年在痴迷于数据可视化的同时,专注于高性能计算、机器学习、量化金融等领域。

前言 R语言强大的统计分析及可视化能力是其他语言所不能比拟的,是统计学界、医学界比较流行的分析语言。正因为如此,R语言被蒙上了异常神秘的面纱,并且由于流行面窄,其优秀的功能不为大众所熟知,特别是在国内R语言基本处于不温不火的状态。 笔者使用R语言多年后发现: 市面上的经典R语言书籍大多出自外国作者,由于文化、原始数据示例均来自国外,增加了学习者理解的难度; 国内不少介绍R语言的书籍,也偏重统计等内容,而且不少书籍的内容安排对初学者不够友好: 可能刚介绍完一个R语言知识点,接着就出现一个复杂的例子,而且理论太多,感觉学了之后,在实际工作中无法运用或者需要很长的酝酿期。 基于上述内容,本书希望解决大多数R语言学习者在学习过程中碰到的难点,聚焦R语言本身数据处理、可视化特点,以举例子的方式循序渐进地讲述R语言数据处理及可视化中用到的经典软件包,以便读者能快速将所学内容运用到实际工作中。 本书主要内容 第1章介绍R语言入门内容,主要介绍R语言是什么、软件的具体安装过程及需要注意的问题。 第2章介绍R语言数据可视化入门知识,主要简要介绍R语言ggplot2可视化基本语法、例子,以便给读者一个大体印象,激励读者继续学习。理论上应该在第1章的基础上讲解数据处理方法,但其是一个枯燥抽象的过程,初学者难以坚持,容易半途而废。 第3章介绍数据储存结构及数据处理(重点章节),介绍R语言中的数据存储结构、数据处理经典包。可视化分析需要数据输入,实际情况中的数据基本上需要重塑处理才能可视化,因此学习可视化分析的重要环节是掌握一定的数据处理技巧。 ...

目录
荐语
查看详情 查看详情

本书源码

目录

第1章R语言介绍及软件安装

1.1R语言介绍

1.2R软件及RStudio软件安装

1.2.1R软件安装

1.2.2RStudio软件安装

1.2.3R及RStudio界面介绍

1.2.4关于R语言程序包

1.2.5R语言基础运算

第2章R语言数据可视化入门

2.1散点图

2.2柱形图及条形图

2.3折线图

2.4饼图

2.5直方图

2.6热力图

2.7其他图形

第3章数据储存结构及数据处理

3.1数据框

3.2向量

3.3列表

3.4矩阵

3.5readr包介绍

3.5.1read_csv()函数

3.5.2其他主要函数

3.6tidyr包

3.6.1expand_grid()函数

3.6.2drop_na()函数

3.6.3replace_na()函数

3.6.4extract()函数

3.6.5fill()函数

3.6.6gather()函数

3.6.7pivot_longer()函数

3.6.8spread()函数

3.6.9pivot_wider()函数

3.7dplyr包

3.7.1select()函数

3.7.2filter()函数

3.7.3mutate()函数

3.7.4group_by()与summarise()函数

3.7.5arrange()函数

3.7.6join(... 查看详情

"★实用性强  系统介绍R语言目前非常流行的tidyverse包集合数据处理能力,特别是其中的dplyr和tidyr包。能满足绝大多数数据处理场景,快速学以致用。
★循序渐进  从R语言软件环境搭建,基本操作开始,循序渐进介绍R语言常用的数据处理能力、ggplot2可视化技巧介绍、ggplot2可视化增强包介绍。最终运用介绍的数据处理及可视化能力,综合展示完整的可视化分析案例。
★内容新颖  详细介绍ggplot2绘图技巧基础上,补充介绍了ggplot2常见的15个增强包,其中大部分内容,属于国内读者较少接触到的知识点。掌握这些内容,可以大大增强读者的可视化能力。
"

查看详情