从熊猫数据框到以n维数组为特征的数据框

Posted

技术标签:

【中文标题】从熊猫数据框到以n维数组为特征的数据框【英文标题】:From pandas dataframe to dataframe with n-dimensional array as feature 【发布时间】:2019-12-07 08:46:46 【问题描述】:

我有一个使用学习平台 (OULAD) 记录用户活动的数据集。每次用户在平台某处点击时,数据集都会显示一行

|用户 ID |日期 | sum_clicks |类 |

我正在尝试获取该数据框,并为每个 user_id 制作一个 n 维向量,每个成员都是当天的点击次数,然后我将在其上执行逻辑回归以尝试基于平台交互预测类别.我敢肯定我可以为此而努力,但感觉应该有一种“熊猫”/ numpy 的方式来做到这一点。有没有人对实现这一目标的最佳方法有所了解?

【问题讨论】:

按 user_id 和日期使用 pandas groupby 数据。然后从 sklearn 使用逻辑回归,如下所示:towardsdatascience.com/… 【参考方案1】:

我使用 .pivot_table 成功了

df.pivot_table(values='sum_click', index=df.user_id, columns='date')

【讨论】:

以上是关于从熊猫数据框到以n维数组为特征的数据框的主要内容,如果未能解决你的问题,请参考以下文章

熊猫数据框到 json 列表格式

熊猫数据框到嵌套 JSON

具有多个键的熊猫数据框到 json

多索引熊猫数据框到字典

熊猫数据框到字典

熊猫数据框到 csv 导出问题