大数据集,使用 unstack() 时收到“Unstacked DataFrame is too big,导致 int32 溢出”

Posted

技术标签:

【中文标题】大数据集,使用 unstack() 时收到“Unstacked DataFrame is too big,导致 int32 溢出”【英文标题】:big dataset, receiving "Unstacked DataFrame is too big, causing int32 overflow" when using unstack() 【发布时间】:2020-07-12 15:45:06 【问题描述】:

我试过pivotgroupby + unstack,都给了我错误。 错误说

“Unstacked DataFrame 太大,导致 int32 溢出”。

我尝试将pandas降级为0.21,但它与python 3.7不兼容,请问有什么解决办法吗?

user_by_movie=  user_items.groupby(['user_id', 'movie_id'])['rating'].min().unstack()

【问题讨论】:

【参考方案1】:

回答

这应该可行,请告诉我。

user_by_movie= user_items.groupby(['user_id', 'movie_id'])['rating'].min().to_frame()

【讨论】:

以上是关于大数据集,使用 unstack() 时收到“Unstacked DataFrame is too big,导致 int32 溢出”的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Unstack 数据可视化 Plotly 热图

使用data_flow_ops构造batch数据集

一文详解:7个 Pandas stack() 和 unstack() 使用技巧

Dataframe.unstack()相当于numpy

Pandas 数据框宽 vs 长 - MULTIPLE df 的 unstack vs pivot vs external join

pandas stack和unstack函数