我如何基于一定值在jupyter中对数据进行分组?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我如何基于一定值在jupyter中对数据进行分组?相关的知识,希望对你有一定的参考价值。
我想对数据框进行分组,以使时间戳列中具有相同小时的行(其数据类似于2019-01-01 00:00:00.134721167,50,100,其中50是成本,而100是百分比)求和平均,以及百分比。或者更具体地说,我需要48行记录2天的信息,每小时一次,而现在我有500行以上。我该怎么办?
答案
这是一种方法:
# sample data
df = pd.DataFrame({'date': pd.date_range("2019-01-01", freq='H', periods = 10),
'cost': pd.np.random.randint(10, 100, 10)})
方法1:
df.set_index('date').resample('H').sum()
方法2:
df.groupby(pd.Grouper(key='date', freq='H'))['cost'].sum().reset_index()
以上是关于我如何基于一定值在jupyter中对数据进行分组?的主要内容,如果未能解决你的问题,请参考以下文章