如何使用点绘制熊猫数据框的两列

Posted

技术标签:

【中文标题】如何使用点绘制熊猫数据框的两列【英文标题】:How to plot two columns of a pandas data frame using points 【发布时间】:2013-07-22 16:29:56 【问题描述】:

我有一个 pandas 数据框,想绘制一列中的值与另一列中的值。幸运的是,有 plot 与数据框相关联的方法似乎可以满足我的需要:

df.plot(x='col_name_1', y='col_name_2')

不幸的是,在绘图样式中(在kind 参数之后列出的here)似乎没有点。我可以使用线条或条形甚至密度,但不能使用点。有没有办法可以帮助解决这个问题。

【问题讨论】:

【参考方案1】:

调用df.plot时可以指定绘制线的style

df.plot(x='col_name_1', y='col_name_2', style='o')

style 参数也可以是dictlist,例如:

import numpy as np
import pandas as pd

d = 'one' : np.random.rand(10),
     'two' : np.random.rand(10)

df = pd.DataFrame(d)

df.plot(style=['o','rx'])

matplotlib.pyplot.plot 的文档中列出了所有可接受的样式格式。

【讨论】:

【参考方案2】:

为此(以及大多数绘图)我不会依赖 Pandas 包装器来实现 matplotlib。相反,直接使用 matplotlib:

import matplotlib.pyplot as plt
plt.scatter(df['col_name_1'], df['col_name_2'])
plt.show() # Depending on whether you use IPython or interactive mode, etc.

请记住,您可以使用 df.col_name_1.values 访问包含列值的 NumPy 数组。

在使用具有毫秒精度的时间戳值列的情况下,我在使用 Pandas 默认绘图时遇到了麻烦。在尝试将对象转换为datetime64 类型时,我还发现了一个令人讨厌的问题:Pandas gives incorrect result when asking if Timestamp column values have attr astype>。

【讨论】:

【参考方案3】:

Pandas 使用matplotlib 作为基本绘图的库。在您的情况下,最简单的方法将使用以下内容:

import pandas as pd
import numpy as np

#creating sample data 
sample_data='col_name_1':np.random.rand(20),
      'col_name_2': np.random.rand(20)
df= pd.DataFrame(sample_data)
df.plot(x='col_name_1', y='col_name_2', style='o')

但是,如果您想要更多自定义绘图而不进入matplotlib. 的基本级别,我建议您使用seaborn 作为替代解决方案。在这种情况下,您的解决方案将如下:

import pandas as pd
import seaborn as sns
import numpy as np

#creating sample data 
sample_data='col_name_1':np.random.rand(20),
      'col_name_2': np.random.rand(20)
df= pd.DataFrame(sample_data)
sns.scatterplot(x="col_name_1", y="col_name_2", data=df)

【讨论】:

【参考方案4】:

现在在最新的 pandas 中,您可以直接使用 df.plot.scatter 函数

df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
                   [6.4, 3.2, 1], [5.9, 3.0, 2]],
                  columns=['length', 'width', 'species'])
ax1 = df.plot.scatter(x='length',
                      y='width',
                      c='DarkBlue')

https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.plot.scatter.html

【讨论】:

以上是关于如何使用点绘制熊猫数据框的两列的主要内容,如果未能解决你的问题,请参考以下文章

如何绘制熊猫数据框的多列

如何合并熊猫数据框中的两列,堆叠在顶部

如何根据合并的数据框之一的两列的值在熊猫数据框中添加值

如何按列绘制数据框的多个字典?蟒蛇熊猫

Pandas:将依赖于第三列的相同数据框的两列相乘

如何将一列中的两列合并为日期与熊猫?