使用 seaborn 绘图时转换 pandas 列中的数据类型

Posted

技术标签:

【中文标题】使用 seaborn 绘图时转换 pandas 列中的数据类型【英文标题】:Conversion of data type in pandas column while plotting using seaborn 【发布时间】:2020-10-23 05:39:37 【问题描述】:

我一直在尝试使用 seaborn regplot 从我的数据集中绘制价格与 km/100L 的关系。我已经尝试将两列的数据类型转换为int64,但它不起作用。

automobile_df["price"].astype("int64")
automobile_df["km/100L"].astype("int64")

然后我尝试使用 seaborn 库中的 regplot 绘制价格与 km/100L 的关系。

sns.regplot(x="km/100L",y="price",data="automobile_df")

我得到的完整错误信息是,

    TypeError                                 Traceback (most recent call last)
<ipython-input-53-fdf8be478666> in <module>()
----> 1 sns.regplot(x="km/100L",y="price",data="temp_df")


/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in regplot(x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, label, color, marker, scatter_kws, line_kws, ax)
    807                                  order, logistic, lowess, robust, logx,
    808                                  x_partial, y_partial, truncate, dropna,
--> 809                                  x_jitter, y_jitter, color, label)
    810 
    811     if ax is None:

/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in __init__(self, x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, color, label)
    107         # Extract the data vals from the arguments or passed dataframe
    108         self.establish_variables(data, x=x, y=y, units=units,
--> 109                                  x_partial=x_partial, y_partial=y_partial)
    110 
    111         # Drop null observations

/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in establish_variables(self, data, **kws)
     43         for var, val in kws.items():
     44             if isinstance(val, str):
---> 45                 vector = data[val]
     46             elif isinstance(val, list):
     47                 vector = np.asarray(val)

TypeError: string indices must be integers

【问题讨论】:

【参考方案1】:

我认为这个问题是因为astype() 默认返回一个副本(请参阅documentation),因此您必须将结果分配给同一列,如下所示:

automobile_df["price"] = automobile_df["price"].astype("int64")
automobile_df["km/100L"] = automobile_df["km/100L"].astype("int64")

或者如果你只是想在绘图的时候改变类型,这样使用它

sns.regplot(x=automobile_df["km/100L"].astype("int64"),y=automobile_df["price"].astype("int64"))

【讨论】:

【参考方案2】:

您只是为数据提供一个字符串,即您的数据框的名称。相反,它应该是数据框本身,所以没有引号。如果您的数据框中的列,还请确保 xy 是正确的名称。

【讨论】:

以上是关于使用 seaborn 绘图时转换 pandas 列中的数据类型的主要内容,如果未能解决你的问题,请参考以下文章

在 pandas 中使用 groupby 命令后使用 seaborn 进行绘图

使用 seaborn 绘图时,如何为色调参数指定多个变量?

数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)

如何使用 Python 在 Seaborn 中保存绘图 [重复]

Seaborn 条形图排序

在 Seaborn 中设置绘图背景颜色