如何从数据框熊猫创建列表

Posted

技术标签:

【中文标题】如何从数据框熊猫创建列表【英文标题】:How to create a list from dataframe pandas 【发布时间】:2021-06-08 08:23:09 【问题描述】:

我的数据集包含他们购买的 usersID 和 itemsID 列。 每个用户可能购买了超过 1 件商品。

我需要创建一个列表,以便键是用户 ID,值是他购买的 itemsID 例如,如果 user_1 购买了 [item_20,item_25,item_32],我的数据集包含该用户的 3 行,如下所示

row_1= 1,20 row_2= 1,25 row_3= 1,32

我希望我的列表包含 fromat 1: [20,25,32]

如上例所示,我想为我的数据集中的所有用户创建一个列表。

【问题讨论】:

到目前为止你有什么尝试? 我创建了一个数据框,在该数据框上我使用了 df.values.tolist() 但我为每一行多次获得了 [userID,itemID] 对。 【参考方案1】:

如果我理解正确,你想要这样的东西!

下次看看你尝试了什么会有所帮助

df = pd.DataFrame('user': ['K0', 'K0', 'K2', 'K3', 'K4', 'K5'],
                   'product': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5'])

my_final_list=
grouped_df=df.groupby(by=["user"])

for key, item in grouped_df:
    products_list=list(grouped_df.get_group(key)["product"])
    my_final_list[key]=products_list

print(my_final_list)

【讨论】:

以上是关于如何从数据框熊猫创建列表的主要内容,如果未能解决你的问题,请参考以下文章

Python:如何从熊猫数据框创建字典? [复制]

如何从数据框熊猫中制作列表列表?

创建具有不相等值列表的熊猫数据框

如何从字典列表中提取数据到熊猫数据框中?

如何从网络抓取创建熊猫数据框?

如何使用 pyarrow 从 S3 读取镶木地板文件列表作为熊猫数据框?