groupby后如何存储

Posted 2023-03-11

技术标签:

【中文标题】groupby后如何存储【英文标题】：How to store after groupby 【发布时间】：2022-01-23 08:21:55 【问题描述】：

使用 groupby 后如何使用该列？比方说

x = df_new.groupby('industry')['income'].mean().sort_values(ascending = False)

会给：

"industry"        
telecommunications        330
crypto.                   100
gas                       100
.
.
.

我想将最高收入的行业名称存储到某个变量中，并将其用于其他查询，所以这里是"telecommunications"。但是做 x[0] 会得到 330...

还请为这个问题推荐一个更好的措辞...不知道正确的术语

【问题讨论】：

我认为，如果您通过your questions 并接受对您有用的答案，您将获得更多答案。 ;) 另外@jun，我建议您对标签选择一丝不苟-最初对于这个问题，您只添加了pandas-groupby标签而没有添加其他标签，所以我（可能还有许多其他人）没有看到它，因为我没有看那个标签。我看pandas 标签。所以一定要尽可能多地添加适当的标签。对此很抱歉.. 也感谢您添加标签 【参考方案1】：

groupby(...).XXX()（其中XXX是一些支持方法，例如mean、sort_values等）典型的返回Series对象，其中index包含分组依据的值。所以你可以使用x.index:

>>> x.index
Index(['telecommunication', 'crypto', 'gas'], dtype='object', name='industry')

如果要获取最大值/最小值的索引，可以使用idxmax/idxmin:

>>> x.idxmax()
'telecommunication'

>>> x.idxmin()
'crypto'

>>> x.index[2]
'gas'

【讨论】：

【参考方案2】：

您也可以使用以下代码将其转换为另一个数据帧

x = df_new.groupby('industry')['income'].mean().sort_values(ascending = False).to_frame(name='mean').reset_index()

【讨论】：

以上是关于groupby后如何存储的主要内容，如果未能解决你的问题，请参考以下文章