使用 seaborn 绘图时转换 pandas 列中的数据类型
Posted
技术标签:
【中文标题】使用 seaborn 绘图时转换 pandas 列中的数据类型【英文标题】:Conversion of data type in pandas column while plotting using seaborn 【发布时间】:2020-10-23 05:39:37 【问题描述】:我一直在尝试使用 seaborn regplot 从我的数据集中绘制价格与 km/100L 的关系。我已经尝试将两列的数据类型转换为int64,但它不起作用。
automobile_df["price"].astype("int64")
automobile_df["km/100L"].astype("int64")
然后我尝试使用 seaborn 库中的 regplot 绘制价格与 km/100L 的关系。
sns.regplot(x="km/100L",y="price",data="automobile_df")
我得到的完整错误信息是,
TypeError Traceback (most recent call last)
<ipython-input-53-fdf8be478666> in <module>()
----> 1 sns.regplot(x="km/100L",y="price",data="temp_df")
/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in regplot(x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, label, color, marker, scatter_kws, line_kws, ax)
807 order, logistic, lowess, robust, logx,
808 x_partial, y_partial, truncate, dropna,
--> 809 x_jitter, y_jitter, color, label)
810
811 if ax is None:
/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in __init__(self, x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, color, label)
107 # Extract the data vals from the arguments or passed dataframe
108 self.establish_variables(data, x=x, y=y, units=units,
--> 109 x_partial=x_partial, y_partial=y_partial)
110
111 # Drop null observations
/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in establish_variables(self, data, **kws)
43 for var, val in kws.items():
44 if isinstance(val, str):
---> 45 vector = data[val]
46 elif isinstance(val, list):
47 vector = np.asarray(val)
TypeError: string indices must be integers
【问题讨论】:
【参考方案1】:我认为这个问题是因为astype()
默认返回一个副本(请参阅documentation),因此您必须将结果分配给同一列,如下所示:
automobile_df["price"] = automobile_df["price"].astype("int64")
automobile_df["km/100L"] = automobile_df["km/100L"].astype("int64")
或者如果你只是想在绘图的时候改变类型,这样使用它
sns.regplot(x=automobile_df["km/100L"].astype("int64"),y=automobile_df["price"].astype("int64"))
【讨论】:
【参考方案2】:您只是为数据提供一个字符串,即您的数据框的名称。相反,它应该是数据框本身,所以没有引号。如果您的数据框中的列,还请确保 x
和 y
是正确的名称。
【讨论】:
以上是关于使用 seaborn 绘图时转换 pandas 列中的数据类型的主要内容,如果未能解决你的问题,请参考以下文章
在 pandas 中使用 groupby 命令后使用 seaborn 进行绘图
数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)