在 R 中绘制简单数据

Posted 2023-02-14

技术标签:

【中文标题】在 R 中绘制简单数据【英文标题】：Plotting Simple Data in R 【发布时间】：2010-10-26 23:27:14 【问题描述】：

我有一个名为 foo.csv 的逗号分隔文件，其中包含以下数据：

scale, serial, spawn, for, worker
5, 0.000178, 0.000288, 0.000292, 0.000300
10, 0.156986, 0.297926, 0.064509, 0.066297
12, 2.658998, 6.059502, 0.912733, 0.923606
15, 188.023411, 719.463264, 164.111459, 161.687982

我基本上有两个问题：

1) 如何绘制第一列（x 轴）与第二列（y 轴）？我正在尝试这个（来自阅读this site）：

data <- read.table("foo.csv", header=T,sep=",")
attach(data)
scale <- data[1]
serial <- data[2]
plot(scale,serial)

但是我得到了这个错误：

Error in stripchart.default(x1, ...) : invalid plotting method

知道我做错了什么吗？ quick Google search 揭示了其他人有同样问题但没有相关答案。更新：事实证明，如果我跳过中间的两个赋值语句，它工作得很好。知道这是为什么吗？

第二个问题紧随第一个问题之后：

2) 如何绘制第一列（x 轴）与 y 轴上的所有其他列？我想一旦我解决了我遇到的第一个问题，这很容易，但我对 R 有点陌生，所以我仍然在思考它。

【问题讨论】：

【参考方案1】：

data <- read.table(...)
plot(data$scale,data$serial)

【讨论】：

【参考方案2】：

有一种简单的绘制方式：

https://code.google.com/p/simple-r/

使用该脚本，您只需输入：

r -cdps, -k1:2 foo.csv

得到你想要的情节。将其置于详细模式 (-v) 以查看相应的 R 脚本。

【讨论】：

【参考方案3】：

在你的例子中，

plot(scale, serial)

不起作用，因为scale 和 serial 都是数据帧，例如

class(scale)
[1] "data.frame"

您可以尝试以下操作并使用points()，在生成绘图后，绘制剩余的列。注意，我使用plot 中的ylim 参数来容纳第三列中的范围。

data <- read.csv('foo.csv', header=T)
plot(data$scale, data$serial, ylim=c(0,750))
points(data$scale, data$spawn, col='red')
points(data$scale, data$for., col='green')
points(data$scale, data$worker, col='blue')

【讨论】：

【参考方案4】：

我是 R 新手，但如果您想在一个绘图中绘制比例与所有其他列，简单且优雅:) 用于打印或演示，您可以使用 Hadley Wickham 教授的软件包 ggplot2 & reshape。

安装：

install.packages(“ggplot2”,dep=T)
install.packages(“reshape”,dep=T)

画出你的例子：

library(ggplot2)
library(reshape)

#read data
data = read.table("foo.csv", header=T,sep=",")

#melt data “scale vs. all”
data2=melt(data,id=c("scale"))
data2

   scale variable      value
1      5   serial   0.000178
2     10   serial   0.156986
3     12   serial   2.658998
4     15   serial 188.023411
5      5    spawn   0.000288
6     10    spawn   0.297926
7     12    spawn   6.059502
8     15    spawn 719.463264
9      5     for.   0.000292
10    10     for.   0.064509
11    12     for.   0.912733
12    15     for. 164.111459
13     5   worker   0.000300
14    10   worker   0.066297
15    12   worker   0.923606
16    15   worker 161.687982

#draw all variables at once as line with different linetypes
qplot(scale,value,data=data2,geom="line",linetype=variable)

您还可以使用点 (geom=”points”)、为不同的变量点选择不同的颜色或形状 (colours=variable or shape=variable)、调整轴、为每条线设置单独的选项等。

链接到online documentation。

【讨论】：

【参考方案5】：

试试这个：

data <- read.csv('foo.csv')
plot(serial ~ scale, data)
dev.new()
plot(spawn ~ scale, data)
dev.new()
plot(for. ~ scale, data)
dev.new()
plot(worker ~ scale, data)

【讨论】：

您可以使用 matplot(data[1],data[2,5],type="b") 或使用 layout(矩阵(c(1,2,3,4),2,2,byrow=TRUE))【参考方案6】：

我远非 R 专家，但我认为您需要一个 data.frame：

plot(data.frame(data[1],data[2]))

它至少在我的 R 设置上绘制了一些东西！

按照 luapyad 的回答中的建议，我想出了这个。我将标题重命名为“比例”：

scaling, serial, spawn, for, worker
5, 0.000178, 0.000288, 0.000292, 0.000300
10, 0.156986, 0.297926, 0.064509, 0.066297
12, 2.658998, 6.059502, 0.912733, 0.923606
15, 188.023411, 719.463264, 164.111459, 161.687982

然后：

foo <- read.table("foo.csv", header=T,sep=",")
attach(foo)
plot( scaling, serial );

【讨论】：

【参考方案7】：

你不需要这两行：

scale <- data[1]
serial <- data[2]

因为 scale 和 serial 已经从 read.table 的标题中设置。

同样scale <- data[1]从data.frame创建一个元素

而来自read.table 的scale 是一个向量

5 10 12 15

而plot(scale, serial) 函数需要向量而不是data.frame，所以你只需要这样做

plot(scale, serial)

在 y 轴上绘制其他数据列的一种方法：

plot(scale,serial, ylab="")
par(new=TRUE) 
plot(scale,spawn,axes=F, ylab="", type="b")
par(new=TRUE) 
plot(scale,for., axes=F, ylab="", type="b")
par(new=TRUE) 
plot(scale,worker,axes=F, ylab="", type="b")

可能有更好的方法可以做到这一点，但这超出了我目前的 R 知识范围......

【讨论】：

那么他的 plot() 调用应该是什么样子？不幸的是，“规模”似乎是某种全球性的。我认为应该没问题（无论如何，以上所有内容在我的 R 上都可以正常工作:)）。 scale 变量将从 read.table 中设置，并且不应干扰“全局”scale() 函数。是的，做到了。感谢您的帮助！

以上是关于在 R 中绘制简单数据的主要内容，如果未能解决你的问题，请参考以下文章