如何创建所有可能的熊猫列组合?

Posted

技术标签:

【中文标题】如何创建所有可能的熊猫列组合?【英文标题】:How to create all possible combinations of pandas columns? 【发布时间】:2020-04-26 06:23:26 【问题描述】:

考虑以下 pandas DF:

col1 col2 col3
1    3     1
2    4     2
3    1     3
4    0     1
2    4     0
3    1     5

如何创建每个 pandas 数据框的所有值的所有可能组合和?例如:

col1 col2 col3 col1_col2 col1_col3 col2_col3
1    3     1       4        2        4   
2    4     2       6        4        6
3    1     3       4        6        4
4    0     1       4        5        1
2    4     0       6        2        4
3    1     5       4        8        6

知道如何在新列中获取所有可能的总和/列组合值吗?

【问题讨论】:

【参考方案1】:

使用itertools.combinationsf-strings 作为新列名的格式:

from  itertools import combinations

for i, j in combinations(df.columns, 2):
    df[f'i_j'] = df[i] + df[j]

print (df)
   col1  col2  col3  col1_col2  col1_col3  col2_col3
0     1     3     1          4          2          4
1     2     4     2          6          4          6
2     3     1     3          4          6          4
3     4     0     1          4          5          1
4     2     4     0          6          2          4
5     3     1     5          4          8          6

使用list comprehensionconcatDataFrame.join 附加到原始的解决方案:

dfs = [(df[i] + df[j]).rename(f'i_j') for i, j in combinations(df.columns, 2)]
df = df.join(pd.concat(dfs, axis=1))
print (df)
   col1  col2  col3  col1_col2  col1_col3  col2_col3
0     1     3     1          4          2          4
1     2     4     2          6          4          6
2     3     1     3          4          6          4
3     4     0     1          4          5          1
4     2     4     0          6          2          4
5     3     1     5          4          8          6

【讨论】:

哇!不知道您可以使用这样的 itertools 组合。 @tumbleweed 有什么理由你还没有接受 jezrael 的回答吗?

以上是关于如何创建所有可能的熊猫列组合?的主要内容,如果未能解决你的问题,请参考以下文章

如何从包含前两列组合的熊猫数据框中删除行

如何组合熊猫数据透视表中的列?

数据框中所有可能的列组合 -pandas/python

Excel:通过“x”创建列 A 和(单独)无限数量的列 B 的所有可能组合

根据条件组合熊猫行[重复]

组合替换熊猫列中的字符串[重复]