R语言初识

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言初识相关的知识,希望对你有一定的参考价值。

2011年,大数据爆发,大数据时代正式来临,当年我刚考入大学,当时的我还不知道会走上程序猿这条不归路.......6年后,本猿开始学习大数据,今天特此记录下.首先学习下R语言.

什么是R语言?

    R语言是用于统计分析,图形表示报告的编程语言和软件环境,是目前最受欢迎的数据分析和可视化平台之一,首次出现在1993年(比我小两岁),最初由Ross IhakaRobert Gentleman在新西兰奥克兰奥克兰大学统计系设计开发,2011年随着大数据的爆发而流行起来.

  R语言的核心是一种解释型的计算机语言,允许使用分支和循环以及函数的模块化编程。 R语言允许与C语言,C++,.Net,Python或FORTRAN语言编写的过程集成,以提高效率。

当然,市面上除了R以外,还有其他数据分析的语言,如:Excel,SPSS,SAS.

R语言的特点?  

如前所述,R语言是用于统计分析,图形表示和报告的编程语言和软件环境。 以下是R语言一些特点列表 -

  • R语言是一种开发良好,简单而有效的编程语言,包括条件,循环,用户定义的递归函数以及输入和输出工具等。
  • R语言有一个有效的数据处理和存储工具,
  • R语言提供了一组运算符,用于对数组,列表,向量和矩阵进行计算。
  • R语言提供了一个大型,一致和集成的数据分析工具集合。
  • R语言提供用于数据分析和直接显示在计算机上或在文档中打印的图形化工具。

为什么选择R?

    免费的,支持Windows/Mac OS/Linux,开源,有众多强大的工具包,更多大公司使用(Twitter,福特,纽约时报,Microsoft,Google);可以完成数据分析设计的几乎所有步骤:数据获取-->数据清理-->数据分析-->结果报告-->发布结果.

在上面的5个步骤当中,数据分析,结果报告,发布结果又更加重要.下面开始简单学习:

数据分析

  •   探索性数据分析

        数据分析中的必要步骤,可以通过作图了解数据,R具备作图能力.

  •   统计推断

       基于数据得出正式结论的过程,但是由于结论具有不确定性(采集数据的样本偏差等).

   比如A,B两人谁更漂亮?现实中萝莉御姐,各有谁爱,所有也就有了不确定性.在普遍的公认中,只要误差率小于5%,就认为该结论是正式结论.

   使用R就可以完成这个关键步骤.

  •   回归分析

  线性回归分析:用线性模型拟合数据,其中,可分为:预测变量,结果变量.

    如,分析房价:预测变量可以有地段,房间大小,政策等等.

          通过预测变量可以得出结果变量   

  非线性回归分析

  •   机器学习-分类问题

    如: 猫 狗 鱼 沙发

    可以让机器对以上物品进行分类.其中需要大量的算法知识. 

  •   开发数据产品 

   如:使用GoogleVis API,R制作html,调用google charts生成html图形 

     使用Manipulate,rCharts,通过R制作javascript可交互图形

     使用shiny,制作嵌入网页的交互式R程序.通过Slidify制作和发布基于R的结果报告. http://www.shinyapps.io/     

结果报告:通过作图和其他总结出数据中的结果信息.  大数据分析竞赛平台

发布结果:  可以通过以下两个平台发布结果 github  rpubs  

 

安装R和Rstudio:

根据平台,下载安装即可

  安装R:  https://cran.r-project.org/

  安装Rstudio https://www.rstudio.com/

 

以上是关于R语言初识的主要内容,如果未能解决你的问题,请参考以下文章

R语言基础教程——第1章:初识R

R语言初识

R语言:自动获取和展示中国宏观杠杆率数据 & 初识 R 语言面向对象的编程:R6 类

《R语言实战》之 图形初阶(第三章)-- 初识

初识R语言—统计篇之正态分布和抽样分布

R语言-Rattle数据挖掘