将列表的数据框重塑为另一个数据框

Posted

技术标签:

【中文标题】将列表的数据框重塑为另一个数据框【英文标题】:Reshape dataframe of list to another dataframe 【发布时间】:2019-04-16 10:10:42 【问题描述】:

我有一个这样的名称和列表数据框:

| Name | value |
|:-----|------:|
| A    |[1,4,7]|
| A    |[9,2,5]|
| A    |[6,9,3]|
| A    |[1,4,7]|
| A    |[9,2,5]|
| B    |[6,9,3]|
| B    |[1,4,7]|
| B    |[9,2,5]|
| B    |[6,9,3]|
| B    |[1,4,7]|

我想将此数据框重塑为另一个数据框,因为所有名称都会有 3 个这样的列表:

| Name |   value   |
|:-----|----------:|
| A    |[1,9,6,1,9]|
| A    |[4,2,9,4,2]|
| A    |[7,5,3,7,5]|
| B    |[6,1,9,6,1]|
| B    |[9,4,2,9,4]|
| B    |[3,7,5,3,7]|

有没有更简单的方法可以通过使用 pandas 来做到这一点?

【问题讨论】:

在我看来 numpy 应该在这里有所帮助。 这看起来像一个转置,然后是一个枢轴 【参考方案1】:

使用groupby+pd.Series+melt

df2 = df.groupby('Name').apply(lambda s: pd.Series([s['value'].str[k].agg(list) for k 
in range(3)])).T.melt()

数据框如下所示:

   Name         value
0   A       [1, 9, 6, 1, 9]
1   A       [4, 2, 9, 4, 2]
2   A       [7, 5, 3, 7, 5]
3   B       [6, 1, 9, 6, 1]
4   B       [9, 4, 2, 9, 4]
5   B       [3, 7, 5, 3, 7]

【讨论】:

【参考方案2】:

你可以,但是很多更好的主意是将你的列表分成单独的系列:

res = pd.concat((pd.DataFrame(np.array(grp['value'].tolist()).T.reshape(3, -1))\
                 .assign(Name=key) for key, grp in df.groupby('Name')),
                ignore_index=True)

print(res)

   0  1  2  3  4 Name
0  1  9  6  1  9    A
1  4  2  9  4  2    A
2  7  5  3  7  5    A
3  6  1  9  6  1    B
4  9  4  2  9  4    B
5  3  7  5  3  7    B

【讨论】:

以上是关于将列表的数据框重塑为另一个数据框的主要内容,如果未能解决你的问题,请参考以下文章

重塑具有列表作为值的熊猫数据框

以键为新列重塑键值对的火花数据框

将熊猫多索引数据框重塑为多列

将数据框转换为另一个数据框,将复合字符串单元格拆分为单独的行[重复]

使用部分字符串匹配将数据框中的列替换为另一个数据框列

使用多个变量和一些时间不变将数据框从宽重塑为面板