将列表的数据框重塑为另一个数据框
Posted
技术标签:
【中文标题】将列表的数据框重塑为另一个数据框【英文标题】:Reshape dataframe of list to another dataframe 【发布时间】:2019-04-16 10:10:42 【问题描述】:我有一个这样的名称和列表数据框:
| Name | value |
|:-----|------:|
| A |[1,4,7]|
| A |[9,2,5]|
| A |[6,9,3]|
| A |[1,4,7]|
| A |[9,2,5]|
| B |[6,9,3]|
| B |[1,4,7]|
| B |[9,2,5]|
| B |[6,9,3]|
| B |[1,4,7]|
我想将此数据框重塑为另一个数据框,因为所有名称都会有 3 个这样的列表:
| Name | value |
|:-----|----------:|
| A |[1,9,6,1,9]|
| A |[4,2,9,4,2]|
| A |[7,5,3,7,5]|
| B |[6,1,9,6,1]|
| B |[9,4,2,9,4]|
| B |[3,7,5,3,7]|
有没有更简单的方法可以通过使用 pandas 来做到这一点?
【问题讨论】:
在我看来 numpy 应该在这里有所帮助。 这看起来像一个转置,然后是一个枢轴 【参考方案1】:使用groupby
+pd.Series
+melt
df2 = df.groupby('Name').apply(lambda s: pd.Series([s['value'].str[k].agg(list) for k
in range(3)])).T.melt()
数据框如下所示:
Name value
0 A [1, 9, 6, 1, 9]
1 A [4, 2, 9, 4, 2]
2 A [7, 5, 3, 7, 5]
3 B [6, 1, 9, 6, 1]
4 B [9, 4, 2, 9, 4]
5 B [3, 7, 5, 3, 7]
【讨论】:
【参考方案2】:你可以,但是很多更好的主意是将你的列表分成单独的系列:
res = pd.concat((pd.DataFrame(np.array(grp['value'].tolist()).T.reshape(3, -1))\
.assign(Name=key) for key, grp in df.groupby('Name')),
ignore_index=True)
print(res)
0 1 2 3 4 Name
0 1 9 6 1 9 A
1 4 2 9 4 2 A
2 7 5 3 7 5 A
3 6 1 9 6 1 B
4 9 4 2 9 4 B
5 3 7 5 3 7 B
【讨论】:
以上是关于将列表的数据框重塑为另一个数据框的主要内容,如果未能解决你的问题,请参考以下文章