从熊猫数据框到以n维数组为特征的数据框
Posted
技术标签:
【中文标题】从熊猫数据框到以n维数组为特征的数据框【英文标题】:From pandas dataframe to dataframe with n-dimensional array as feature 【发布时间】:2019-12-07 08:46:46 【问题描述】:我有一个使用学习平台 (OULAD) 记录用户活动的数据集。每次用户在平台某处点击时,数据集都会显示一行
|用户 ID |日期 | sum_clicks |类 |
我正在尝试获取该数据框,并为每个 user_id 制作一个 n 维向量,每个成员都是当天的点击次数,然后我将在其上执行逻辑回归以尝试基于平台交互预测类别.我敢肯定我可以为此而努力,但感觉应该有一种“熊猫”/ numpy 的方式来做到这一点。有没有人对实现这一目标的最佳方法有所了解?
【问题讨论】:
按 user_id 和日期使用 pandas groupby 数据。然后从 sklearn 使用逻辑回归,如下所示:towardsdatascience.com/… 【参考方案1】:我使用 .pivot_table 成功了
df.pivot_table(values='sum_click', index=df.user_id, columns='date')
【讨论】:
以上是关于从熊猫数据框到以n维数组为特征的数据框的主要内容,如果未能解决你的问题,请参考以下文章