python 分组并迭代数据帧,将值分配到列表,然后与原始值合并

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 分组并迭代数据帧,将值分配到列表,然后与原始值合并相关的知识,希望对你有一定的参考价值。

group = df.groupby('title')
author_counts = group.apply(lambda x: x['author'].nunique()).reset_index().rename(columns={0:'author_count'})

df_five= author_counts[author_counts.author_count<=5]

df_five['authors'] = [list(set(df['author'].loc[df['title'] == x['title']])) 
    for _, x in df_five.iterrows()]
    

df_copy = df.copy()
del df_copy['author']
df_copy.drop_duplicates(keep='first',inplace=True)
merge =df_five.merge(df_copy, on='title', how='left') 

以上是关于python 分组并迭代数据帧,将值分配到列表,然后与原始值合并的主要内容,如果未能解决你的问题,请参考以下文章

Python - 用于将值从列表分配到 DataFrame 列表的列表理解表达式

Spark迭代算法UDF在每次迭代中被多次触发

熊猫,我怎样才能避免使用 iterrow (如何根据来自另一个数据帧的值将值分配给数据帧中的新列)

将数据帧分组到列表中

在函数的每次迭代中动态更新输入数据帧,无需全局分配

在python中将列从一个数据帧添加到分组数据帧