如何在 R 中读取具有重复列的羽毛文件

Posted

技术标签:

【中文标题】如何在 R 中读取具有重复列的羽毛文件【英文标题】:How read feather file with duplicative columns in R 【发布时间】:2020-03-26 16:10:12 【问题描述】:

我在读取包含 2 列以上名称重复的羽毛格式的数据文件时遇到问题。是否可以在元数据级别删除重复名称或以某种方式加载具有重复名称的数据。

假设数据集“mtcars”保存在磁盘上并由

feather_metadata("mtcars")

给予

[32 x 12]@mtcars

'mpg' : double

'mpg' : double

'mpg' : double

'cyl':双

'disp':双倍

使用"read_feather("mtcars")会产生错误

错误:列名mpgmpg,不得重复。 使用 .name_repair 指定修复。

如何解决这个问题?

【问题讨论】:

install.packages('feather'),也许?我没有受到格式的挑战,但是feather 【参考方案1】:

这是我找到的一个解决方案——按列索引读取数据:

read_feather("mtcars", columns = c(1, 4, 5)

这允许传递重复的列。

【讨论】:

以上是关于如何在 R 中读取具有重复列的羽毛文件的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 VBA 在 Excel 宏中删除具有两列的重复项?

如何使用 R 中的 magick 包在图像边缘添加羽毛?

如何原生阅读羽毛文件?

如何从具有多级重复列的excel表中取消堆叠df?设置多索引?

如何读取具有动态名称的文件,同时避免在 R 中进行硬编码?

如何在 R 中读取具有不同列数的 CSV 文件