像在 Qlik 中一样在 Pandas 中做 Crosstable?
Posted
技术标签:
【中文标题】像在 Qlik 中一样在 Pandas 中做 Crosstable?【英文标题】:Doing Crosstable in Pandas like in Qlik? 【发布时间】:2018-02-07 04:27:05 【问题描述】:我有一个数据框:
df1=pd.DataFrame(
'ID':[101,102],
'Name':['Axel','Bob'],
'US':['GrA','GrC'],
'Europe':['GrB','GrD'],
'AsiaPac':['GrZ','GrF']
)
我想改成这个:
df2=pd.DataFrame(
'ID':[101,101,101,102,102,102],
'Name':['Axel','Axel','Axel','Bob','Bob','Bob'],
'Region':['US','Europe','AsiaPac','US','Europe','AsiaPac'],
'Group':['GrA','GrB','GrZ','GrC','GrD','GrF']
)
我该怎么做? pandas 中有一个交叉表功能,但它不这样做。在 Qlik 我会简单地做
Crosstable(Region,Group,2)
LOAD
ID,
Name,
US,
Europe,
AsiaPac
我会从 df1 转到 df2。我怎样才能在 python(熊猫或其他)中做到这一点?
【问题讨论】:
【参考方案1】:这实质上是将您的数据从宽格式重塑为长格式,正如 R 语言中所说的那样。在 pandas 中,您可以使用 pd.melt
:
pd.melt(df1, id_vars=['ID', 'Name'], var_name='Region', value_name='Group')
# ID Name Region Group
# 0 101 Axel AsiaPac GrZ
# 1 102 Bob AsiaPac GrF
# 2 101 Axel Europe GrB
# 3 102 Bob Europe GrD
# 4 101 Axel US GrA
# 5 102 Bob US GrC
如果您需要按ID
或Name
和Group
对列进行排序,如示例输出所示,您可以将.sort_values()
添加到表达式中:
pd.melt(df1, id_vars=['ID', 'Name'], var_name='Region', value_name='Group').sort_values(['ID', 'Group'])
# ID Name Region Group
# 4 101 Axel US GrA
# 2 101 Axel Europe GrB
# 0 101 Axel AsiaPac GrZ
# 5 102 Bob US GrC
# 3 102 Bob Europe GrD
# 1 102 Bob AsiaPac GrF
【讨论】:
var_name
和value_name
有什么区别?【参考方案2】:
你可以试试
第一个
stack()
df1.set_index(['ID','Name']).stack().reset_index().rename(columns='level_2':'Region',0:'Group')
Out[890]:
ID Name Region Group
0 101 Axel AsiaPac GrZ
1 101 Axel Europe GrB
2 101 Axel US GrA
3 102 Bob AsiaPac GrF
4 102 Bob Europe GrD
5 102 Bob US GrC
第二次
pd.wide_to_long
,即使是矫枉过正。 :)
df1=df1.rename(columns='AsiaPac':'Group_AsiaPac','Europe':'Group_Europe','US':'Group_US')
pd.wide_to_long(df1,['Group'], i=['ID','Name'], j='Region',sep='_',suffix='.').reset_index()
Out[918]:
ID Name Region Group
0 101 Axel AsiaPac GrZ
1 101 Axel Europe GrB
2 101 Axel US GrA
3 102 Bob AsiaPac GrF
4 102 Bob Europe GrD
5 102 Bob US GrC
【讨论】:
@AlhpaDelta Yw~以上是关于像在 Qlik 中一样在 Pandas 中做 Crosstable?的主要内容,如果未能解决你的问题,请参考以下文章
有没有办法像在 C++ 中挂钩非托管函数一样在 C# 中挂钩托管函数?
有没有办法像在 C++ 中挂钩非托管函数一样在 C# 中挂钩托管函数?