R语言中的基本函数使用 - 更新中

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言中的基本函数使用 - 更新中相关的知识,希望对你有一定的参考价值。

参考技术A 用法:assign(x, value, pos = -1, envir = as.environment(pos),  inherits = FALSE, immediate = TRUE)

assign函数在循环时候,给变量赋值。

举例说明:

1、

for (i in 1:(length(rowSeq)-1))

  assign(paste("nginx_server_fields7_", i, sep = ""), nginx_server_fields7[(rowSeq[(i-1)+1]):(rowSeq[i+1]), ])



2、

for (i in 1:3)

    assign(paste("a", i, sep = ""), i:10)



ls()

[1] "a1" "a2" "a3" "i"

> a1

[1]  1  2  3  4  5  6  7  8  9 10

> a2

[1]  2  3  4  5  6  7  8  9 10

>a3

[1] 3  4  5  6  7  8  9 10

1、paste函数可用于字符串连接

用法:paste (..., sep = " ", collapse = NULL),分隔符默认为空格

我们简单举个例子

1)paste("a","b") ##能连接a b

[1] "a b"

paste("a","b","c")

[1] "a b c"

2)设置分隔符paste("a","b",sep="=") ##注意到用等号分隔了

[1] "a=b"

3)连接多个元素paste("a",1:5,sep="") ##会自动每个元素与a相连

[1] "a1""a2""a3""a4""a5"

4)paste("a",1:5,".pdf",sep="") ##比如想批量输出文件名

[1] "a1.pdf""a2.pdf""a3.pdf""a4.pdf""a5.pdf"、

2、collapse参数

谢益辉大佬说这个参数引无数英雄竞折腰啊,大家只会sep

1)paste("a",1,collapse="+") ##注意到了吧,collapse没用上

[1] "a 1"

2)paste(c("a","b","c"),collapse="+") ##这样就很容易理解了,collapse折叠起了元素

[1] "a+b+c"

3)paste("a",1:5,sep="") ##再来更明显的举例

[1] "a1""a2""a3""a4""a5"

4)paste("a",1:5,sep="",collapse="+") ##先在元素间连接,然后折叠

[1] "a1+a2+a3+a4+a5"

3、与paste0函数的区别

paste0函数,默认sep=""是两个函数唯一的区别

paste(c("a","b","c"),1:3)##默认空格符

[1] "a 1""b 2""c 3"

paste(c("a","b","c"),1:3,sep=" ")

[1] "a 1""b 2""c 3"

paste(c("a","b","c"),1:3,sep="")

[1] "a1""b2""c3"

如果两个向量长度不同paste(c("a","b","c"),1:5) ##超出范围后继续从前向后连接

[1] "a 1"  "b 2"  "c 3"  "a 4"  "b 5"

paste0(c("a","b","c"),1:3)#默认元素连接为sep=""

[1] "a1""b2""c3"

用法:unlist()函数的作用,就是将list结构的数据du,变zhi成非list的数据,即将list数据变成 字符串向量 或者数字向量的形式

如果是向量的话就直接输出向量

例子:

%in%相当于match()函数的一个缩写。用来判断一个数组或矩阵是否包含在另一个数组或矩阵里。举个例子一目了然:

#首先复制两个变量a和b

>a <- 1:5

>b <- 3:7

>a %in% b    #看a的元素是否包含在b中输出结果如下:

[1] FALSE FALSE  TRUE  TRUE  TRUE

用法:apply(x, MARGIN, FUN, ...)

作用:对 矩阵 的行或列使用函数,或者对 数组 的各个维度使用函数

x为数据对象,MARGIN是维度的下标,MARGIN=1表示行,MARGIN=2表示列,FUN是自己指定的任意或自定义函数

注:数据框dataframe也可以使用apply函数,该函数会自动将数据框转化为矩阵,但前提是数据框中各列的数据类型 必须是数值型,否则会报错。

用法:lapply(x,FUN,...)

作用:对列表中的各个元素使用函数

x是格式为列表的数据源,FUN是任意函数。

intersect(data1,data2):交集

union(data1,data2):并集

R语言 平均值,中位数和模式

R中的统计分析通过使用许多内置函数来执行。这些函数大多数是R基础包的一部分。这些函数将R向量作为输入和参数,并给出结果。

我们在本章中讨论的功能是平均值,中位数和模式。

Mean平均值

通过求出数据集的和再除以求和数的总量得到平均值

函数mean()用于在R语言中计算平均值。

语法

用于计算R中的平均值的基本语法是 -

mean(x, trim = 0, na.rm = FALSE, ...)

以下是所使用的参数的描述 - 

  • x是输入向量。

  • trim用于从排序向量的两端丢弃一些观察结果。

  • na.rm用于从输入向量中删除缺失值。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <- mean(x)
print(result.mean)

当我们执行上面的代码,它产生以下结果 -

[1] 8.22

应用修剪选项

当提供trim参数时,向量中的值被排序,然后从计算平均值中减去所需的观察值。

当trim = 0.3时,来自每端的3个值将从计算中减去以找到均值。

在这种情况下,排序的向量是(-21,-5,2,3,4.2,7,8,12,18,54),并且从用于计算平均值的向量中移除的值是(-21,-5,2) 从左边和(12,18,54)从右边。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <- mean(x,trim = 0.3)
print(result.mean)

当我们执行上面的代码,它产生以下结果 -

[1] 5.55

应用NA选项

如果有缺失值,则平均函数返回NA。

要从计算中删除缺少的值,请使用na.rm = TRUE。这意味着去除NA值。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)

# Find mean.
result.mean <- mean(x)
print(result.mean)

# Find mean dropping NA values.
result.mean <- mean(x,na.rm = TRUE)
print(result.mean)

当我们执行上面的代码,它产生以下结果 -

[1] NA
[1] 8.22

Median中位数

数据系列中的最中间值称为中值。在R语言中使用median()函数来计算此值。

语法

计算R语言中位数的基本语法是 -

median(x, na.rm = FALSE)

以下是所使用的参数的描述 - 

  • x是输入向量。

  • na.rm用于从输入向量中删除缺失值。

# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find the median.
median.result <- median(x)
print(median.result)

当我们执行上面的代码,它产生以下结果 -

[1] 5.6

Mode模式

模式是一组数据中出现次数最多的值。Unike平均值和中位数,模式可以同时包含数字和字符数据。

R语言没有标准的内置函数来计算模式。因此,我们创建一个用户函数来计算R语言中的数据集的模式。该函数将向量作为输入,并将模式值作为输出。

# Create the function.
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}

# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)

# Calculate the mode using the user function.
result <- getmode(v)
print(result)

# Create the vector with characters.
charv <- c("o","it","the","it","it")

# Calculate the mode using the user function.
result <- getmode(charv)
print(result)

当我们执行上面的代码,它产生以下结果 -

[1] 2
[1] "it"


以上是关于R语言中的基本函数使用 - 更新中的主要内容,如果未能解决你的问题,请参考以下文章

R语言函数

r语言createdatapartition在哪个函数中

R语言pacman包管理R编程语言需要的包实战:使用p_load函数安装和加载多个R包使用p_unload函数卸载多个R包使用p_update函数更新过期的R包

R语言中的apply函数族

R语言 平均值,中位数和模式

R语言 直方图