用更少的时间在 R 中绘制大型数据集

Posted

技术标签:

【中文标题】用更少的时间在 R 中绘制大型数据集【英文标题】:plot large data set in R with less time 【发布时间】:2014-03-01 04:30:37 【问题描述】:

我有两个巨大的数据集,不是很大,两个 5000*5000 的双矩阵。 假设矩阵名称是 A 和 B,

我试过了

plot(as.vector(A),as.vector(B))

但这似乎需要永远......是否有任何建议的包来绘制如此大的数据集?

基本上,我正在绘制 x=(2.5E+07), y=(2.5E+07),相当庞大但大小合理的数据集。

【问题讨论】:

这种事情之前已经讨论过了,见:stats.stackexchange.com/questions/7348/… and biostars.org/p/47288 and ***.com/questions/10945707/… 【参考方案1】:

如果您尝试创建散点图,那么“hexbin”包可能会提供更好的图,因为具有 25M 点的图很难理解。如果你真的想使用“绘图”,那么试试这个参数

pch="."

【讨论】:

以上是关于用更少的时间在 R 中绘制大型数据集的主要内容,如果未能解决你的问题,请参考以下文章

seaborn的调色板刻度边框标签数据集等的一些解释

用更少的循环优化css?

RDD 与Spark 生产代码的数据集

原来PHP对象比数组用更少的内存

VBO 不会绘制,大型数据集

使用媒体查询中的类集作为更少的mixin