R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程

Posted 文宇肃然

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程相关的知识,希望对你有一定的参考价值。

1. 数据分析的开端,Tidyverse?

tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导他们完成工作流程,促进沟通并产生可重复的工作产品。tidyverse 本质上侧重于使工作流成为可能的工具的互联。在数据科学项目中采用 tidyverse有很多优势。它提供一致的功能、工作流覆盖范围、数据科学教育、数据科学工具开发的简化路径以及提高生产力的潜力。

它的主要目标之一是帮助任何需要分析数据的人高效地工作。如下图所示,tidyverse可以帮助你实现:

  1. 数据导入/导出

  2. 数据清洗处理

  3. 批量建模

  4. 数据/模型结果可视化

  5. 生成(可交互)的分析报告. (eg. pdf, word, ppt)

本文主要讨论前两个目标及数据的创建导入导出,以及数据清洗处理。

  • tidyverse核心:管道操作 %>%

进行数据分析前先导入必要的包和数据:

1library(tidyverse)
2library(rio)
3data("german", package = "rchallenge") 

首先查看你的数据集:

以上是关于R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程的主要内容,如果未能解决你的问题,请参考以下文章

R语言实战应用精讲50篇(三十二)-R语言实现单变量时间序列(附R语言代码)

R语言实战应用精讲50篇(三十五)-R语言实现xgboost回归(附R语言代码)

R语言实战应用精讲50篇(三十)-R语言实现支持向量机(附R语言代码)

R语言实战应用精讲50篇(三十三)-R-circlize包应用案例详解(附R语言代码)

R语言实战应用精讲50篇(二十八)-大量代码示例带你从基础到高级(附R语言代码)

R语言实战应用精讲50篇(十六)--如何实现文字云可视化