groupby后如何存储
Posted
技术标签:
【中文标题】groupby后如何存储【英文标题】:How to store after groupby 【发布时间】:2022-01-23 08:21:55 【问题描述】:使用 groupby 后如何使用该列? 比方说
x = df_new.groupby('industry')['income'].mean().sort_values(ascending = False)
会给:
"industry"
telecommunications 330
crypto. 100
gas 100
.
.
.
我想将最高收入的行业名称存储到某个变量中,并将其用于其他查询,所以这里是"telecommunications"
。
但是做 x[0] 会得到 330...
还请为这个问题推荐一个更好的措辞...不知道正确的术语
【问题讨论】:
我认为,如果您通过your questions 并接受对您有用的答案,您将获得更多答案。 ;) 另外@jun,我建议您对标签选择一丝不苟-最初对于这个问题,您只添加了pandas-groupby
标签而没有添加其他标签,所以我(可能还有许多其他人)没有看到它,因为我没有看那个标签。我看pandas
标签。所以一定要尽可能多地添加适当的标签。
对此很抱歉.. 也感谢您添加标签
【参考方案1】:
groupby(...).XXX()
(其中XXX
是一些支持方法,例如mean
、sort_values
等)典型的返回Series对象,其中index包含分组依据的值。所以你可以使用x.index
:
>>> x.index
Index(['telecommunication', 'crypto', 'gas'], dtype='object', name='industry')
如果要获取最大值/最小值的索引,可以使用idxmax
/idxmin
:
>>> x.idxmax()
'telecommunication'
>>> x.idxmin()
'crypto'
>>> x.index[2]
'gas'
【讨论】:
【参考方案2】:您也可以使用以下代码将其转换为另一个数据帧
x = df_new.groupby('industry')['income'].mean().sort_values(ascending = False).to_frame(name='mean').reset_index()
【讨论】:
以上是关于groupby后如何存储的主要内容,如果未能解决你的问题,请参考以下文章
如何将pandas dataframe进行groupby操作后得到的数据结构转换为dataframe?