如何将数据和索引设置为 pandas 数据框

Posted

技术标签:

【中文标题】如何将数据和索引设置为 pandas 数据框【英文标题】:how do i set data and index into pandas dataframe 【发布时间】:2020-05-24 11:11:45 【问题描述】:

我有这样的查询

test = spark.sql("select mg.moviegenreid, sum(quantity) as total \
                from moviegenre mg \
                join movie m on m.moviegenreid = mg.moviegenreid \
                join detailtransaction dt on dt.movieid = m.movieid \
                join headertransaction ht on ht.transactionid = dt.transactionid \
                group by mg.moviegenreid \
                having sum(quantity) \
                order by total desc \
                limit 5")

然后我将它插入到 pandas 数据帧中

data = test.toPandas()

我只想使用

制作小节线
x = data["moviegenreid"]
y = data["total"
val = pd.DataFrame(data=y,index=x)
val.plot.bar()

我总是遇到这样的错误

ValueError: Index data must be 1-dimensional

【问题讨论】:

【参考方案1】:

试试:

x = data["moviegenreid"]
y = data["total"]
val = pd.DataFrame('data'=y,index=x)
val.plot.bar()

【讨论】:

它的工作很完美,但是,任何不同的 data["moviegenreid"] 与 data["moviegenreid"] 是如何工作的。非常感谢你:)

以上是关于如何将数据和索引设置为 pandas 数据框的主要内容,如果未能解决你的问题,请参考以下文章

为 pandas 数据框 Python 设置索引

Python Pandas:如何将数据框列值设置为 X 轴标签

如何将熊猫数据框的列设置为列表

Pandas - 根据日期将数据框拆分为多个数据框?

Pandas:如何将列(坏数据)中的太大值设置为零,我应该使用 if 函数还是完全不同的东西? [复制]

如何在 Pandas 中正确旋转或重塑时间序列数据框?