如何在大型矩阵中合并具有相似名称的列

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在大型矩阵中合并具有相似名称的列相关的知识,希望对你有一定的参考价值。

我正在尝试使用R studio将微生物数据矩阵中的列合并。当我将.csv导入R中时,如下所示:

        species.1   taxa.1   species.2   another.1  taxa.2
ind1    2           4        2           4          3
ind2    4           2        6           3          0

而且我希望它看起来像:

       species    taxa    another
ind1   4          7       4
ind2   10         2       3

我已经看到了不同的代码,这些代码可以使我在小规模上执行此操作,但是我需要一些东西来帮助我针对大型数据集(54x521)进行协调。

答案

假设您的矩阵称为dt,您可以这样做:

使用基数R,您可以这样做

sapply(split.default(data.frame(dt),sub("\..*","",colnames(dt))),rowSums)

     another species taxa
ind1       4       4    7
ind2       3      10    2

以上是关于如何在大型矩阵中合并具有相似名称的列的主要内容,如果未能解决你的问题,请参考以下文章

如何将外观相似的列合并为一个并在熊猫中为其分配名称?

具有numpy的大型稀疏矩阵的余弦相似度

熊猫合并具有不同名称的列并避免重复[重复]

如何在pyspark中连接具有相同名称的列的值

按 ID 合并两个 Excel 文件并合并具有相同名称的列(python、pandas)

将来自不同文件夹的多个 csv 文件(相似名称)合并到一个 csv 中并逐行绑定它们 [关闭]