如何在 R 中加载大数据? [复制]

Posted

技术标签:

【中文标题】如何在 R 中加载大数据? [复制]【英文标题】:How to load big data in R? [duplicate] 【发布时间】:2014-09-16 21:25:01 【问题描述】:

我有超过 100 列的 1600 万条客户记录。我有兴趣在 R 中加载完整数据并希望在其上运行我的 R 代码。

我使用以下方法在 R 中加载数据:

read.table("D:/data.txt",header = TRUE, sep = "þ",
           skipNul = TRUE,strip.white = TRUE,
           fill=TRUE, check.names = TRUE,na.string="NA",quote="")

但是我的系统挂了。

有没有什么高效有效的读取大数据的方法?

【问题讨论】:

你的设备有多“大”? 这个调用检查了很多东西,它应该很慢。您是否尝试过减少参数列表并可能分块阅读?具有讽刺意味的是,您忽略了建议使用read.table 实现最大效率的论点 如果该死的东西不适合你的可用内存,你将不得不阅读High performance task view。 【参考方案1】:
library(data.table)

DT <- fread("D:/data.txt")

如果您正在处理该大小的数据,您可能希望使用data.table ;)

【讨论】:

我使用了以下内容:d

以上是关于如何在 R 中加载大数据? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Qt 中从 txt 文件中加载大数据

如何使用角度6的分页,过滤,排序功能在表组件中加载大数据

如何在unity3d中加载大工程模型

如何在 Google BigQuery 中加载大文本文件

如何在 MATLAB 中加载大文件(~150MB)?

在 Pandas 数据框中加载大表时,如何避免 EC2 中的内存错误?