用R做数据分析,一项科研必备基本功

Posted 中外学术情报

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用R做数据分析,一项科研必备基本功相关的知识,希望对你有一定的参考价值。

中外学术情报
扫码加入本站专家群

用R做数据分析,一项科研必备基本功


作为一种专门为统计和数据分析开发的语言,R语言想必大家都早已久闻大名。它现在基本上已经成为了数据统计分析的必备工具,也是我们在科研工作中必学必用的一款神器。


为什么这么说呢?那是因为R语言具有无与伦比的优势,其中包括:


1. 它是免费、开源的;

2. 它是专门为统计和数据分析开发的语言,各种功能和函数琳琅满目,其中成熟稳定的包很多;

3. 它十分地简单易学;

4. 它的软件本身轻便,运行起来系统负担也小;
5. 它同各种OS的兼容性非常好;

6. 它极受欢迎,使用的人很多;

7. 它的各种包和函数的透明性极好,这使得对函数的调整和改良变得非常便利,只需要把源码调出来,自己稍微修改一下就可以了;

8. 用它生成的图,漂亮又灵活,简直帅呆了……


可是,R语言这么好,又这么有用,怎么最快最真接地去学呢?有同学报怨,虽然知道它重要,再不学习怕被淘汰了,但是网上信息一大把,既不简洁又无条理,看着真心心烦,不知怎么入手啊。


考虑到大家的这一难处,中外学术情报专门邀请了美国名校Jack老师来给大家讲授“精品R语言应用课:R语言做统计分析”这个课。Jack老师是信息科学博士,在信息与数据科学研究方法与软件操作方面经验老道,并拥有丰富教学经验。让他讲这个方法,实在太适合不过了。

 

本系列课程共分五小节,讲课中,老师极其注意效率,内容丰富,全面系统。外加这是个视频课,直观可视,简直是一学就会,一听就懂。



具体来说,该课程包括但不限于以下重要内容:


第一讲R的环境搭建

1. R

2. R IDE

3. 工作环境和包

第二讲R的数据组织

1. 存储角度划分

1.1 数值型

1.2 字符型

1.3 逻辑型

2. 存储结构角度划分

2.1 向量

2.2 矩阵

2.3 数组

2.4 数据框

2.5 列表

3. 数据的创建和访问

4. 从文本读数据的方式 

第三讲R的数据管理

1.数据合并

2. 数据排序

3. 缺失数据报告

4. 变量计算

5. 自定义函数

6.  数据筛选

7.  数据保存

8. 数据管理中的控制流程 

第四讲R的基本数据分析

 1. 数值型单变量的描述

1.1 集中趋势、离散程度等

1.2 均值、中位数方差等

2. 计算统计量描述

2.1 计算基本描述统计量

2.2 计算多个变量的某个描述统计量

2.3 分类型单变量的描述

相关性分析

3.1 两数值型变量相关性的分析

3.2 相关系数

3.3 简单相关系数的检验

第五讲R的基本数据分析:
可视化

1. 茎叶图

2. 箱线图

gplot(data10, aes(x=factor(data10$rating),y=data10$num_adjectives))+geom_boxplot()

3. 直方图与核密度图

4. 小提琴图

5. 克利夫兰点图

 6.折线图

Plot type=:

p:仅数据点,默认值。l:仅线段b:线段与点c:仅线段,但点的位置留出空白o:线段与点,但线段会延伸到点内部

h:直方图风格,即带竖直密度线s:阶梯图S:其他特殊情况n:  不绘制图形。用于指定标题、坐标轴名称的情况

7. 柱形图

8. 饼图和扇形图

9. 马赛克图


通过本系列课程,可以迅速掌握使用R语言进行环境搭建、数据组织、数据管理、基本数据分析以及可视化呈现等,为你解决数据统计分析的疑难问题。


听说开了这个课,很多同学和老师都来听了。点击阅读原文,抓紧学起来吧!

以上是关于用R做数据分析,一项科研必备基本功的主要内容,如果未能解决你的问题,请参考以下文章

i学堂:基于R语言的科研数据可视化

网络精讲 | 用R语言做统计初高级速成班(7.25-26)

mysql的基本语法

备战数学建模26 & 科研必备-Python数据可视化之matplotlib

一周内教会您用R语言挖掘公共数据库(TCGAGEO)发表文章 9月21-25日 线上班

科研必备,破解大数据散点overlap的6种姿势