R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程相关的知识,希望对你有一定的参考价值。
1. 数据分析的开端,Tidyverse?
tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导他们完成工作流程,促进沟通并产生可重复的工作产品。tidyverse 本质上侧重于使工作流成为可能的工具的互联。在数据科学项目中采用 tidyverse有很多优势。它提供一致的功能、工作流覆盖范围、数据科学教育、数据科学工具开发的简化路径以及提高生产力的潜力。
它的主要目标之一是帮助任何需要分析数据的人高效地工作。如下图所示,tidyverse可以帮助你实现:
-
数据导入/导出
-
数据清洗处理
-
批量建模
-
数据/模型结果可视化
-
生成(可交互)的分析报告. (eg. pdf, word, ppt)
本文主要讨论前两个目标及数据的创建导入导出,以及数据清洗处理。
-
tidyverse核心:管道操作 %>%
进行数据分析前先导入必要的包和数据:
1library(tidyverse)
2library(rio)
3data("german", package = "rchallenge")
首先查看你的数据集:
以上是关于R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程的主要内容,如果未能解决你的问题,请参考以下文章
R语言实战应用精讲50篇(三十二)-R语言实现单变量时间序列(附R语言代码)
R语言实战应用精讲50篇(三十五)-R语言实现xgboost回归(附R语言代码)
R语言实战应用精讲50篇(三十)-R语言实现支持向量机(附R语言代码)
R语言实战应用精讲50篇(三十三)-R-circlize包应用案例详解(附R语言代码)