使用 Python 分割数据并用实线和虚线绘制它们
Posted
技术标签:
【中文标题】使用 Python 分割数据并用实线和虚线绘制它们【英文标题】:Split data and plot them with solid and dashed lines with Python 【发布时间】:2020-03-29 22:19:17 【问题描述】:我想将以下数据分成两部分:observed
from 2018-09
到 2019-11
和 predicted
从 2019-12
到日期列的末尾,分别用实线和虚线绘制它们@ 987654326@、plotly
或seaborn
等
date price pct
0 2018-09 10.599 0.020
1 2018-10 10.808 0.020
2 2018-11 10.418 -0.036
3 2018-12 10.166 -0.024
4 2019-01 9.995 -0.017
5 2019-02 10.663 0.067
6 2019-03 10.559 -0.010
7 2019-04 10.055 -0.048
8 2019-05 10.691 0.063
9 2019-06 10.766 0.007
10 2019-07 10.667 -0.009
11 2019-08 10.504 -0.015
12 2019-09 10.284 -0.021
13 2019-10 10.047 -0.023
14 2019-11 9.717 -0.033
15 2019-12 9.908 -0.029
16 2020-01 9.570 -0.045
17 2020-02 9.754 -0.023
18 2020-03 9.779 -0.025
19 2020-04 9.777 -0.031
20 2020-05 9.932 -0.020
我尝试过如下代码,首先我得到一个错误,其次我还没有绘制pct
。有人可以帮忙吗?谢谢。
df = df.set_index('date')
plt.plot('date', 'price', data=df.loc['2018-09':'2019-11'], marker='o', color='green', linewidth=2)
plt.plot('date', 'price', data=df.loc['2019-12':], marker='o', color='green', linewidth=2, linestyle = '--')
它生成ValueError: x and y must have same first dimension, but have shapes (1,) and (15,)
编辑:此代码已成功绘制 price
的绘图,但我需要在同一绘图上绘制 pct
。
df['date'] = pd.to_datetime(df['date'])
# https://***.com/questions/46230864/split-dataframe-on-the-basis-of-date
split_date ='2019-12-01'
plt.figure(figsize=(10, 5))
plt.plot('date', 'rent_price', data = df.loc[df['date'] <= split_date], marker='o', color='red', linewidth=2)
plt.plot('date', 'rent_price', data = df.loc[df['date'] >= split_date], marker='o', color='green', linewidth=2, linestyle = '--')
【问题讨论】:
【参考方案1】:我认为你所描述的最好用这样的情节来说明:
完整代码:
# imports
from plotly.subplots import make_subplots
import plotly.graph_objects as go
import pandas as pd
# your data
df = pd.DataFrame('date': 0: '2018-09',
1: '2018-10',
2: '2018-11',
3: '2018-12',
4: '2019-01',
5: '2019-02',
6: '2019-03',
7: '2019-04',
8: '2019-05',
9: '2019-06',
10: '2019-07',
11: '2019-08',
12: '2019-09',
13: '2019-10',
14: '2019-11',
15: '2019-12',
16: '2020-01',
17: '2020-02',
18: '2020-03',
19: '2020-04',
20: '2020-05',
'price': 0: 10.599,
1: 10.808,
2: 10.418,
3: 10.166,
4: 9.995,
5: 10.663,
6: 10.559000000000001,
7: 10.055,
8: 10.690999999999999,
9: 10.765999999999998,
10: 10.667,
11: 10.504000000000001,
12: 10.284,
13: 10.047,
14: 9.717,
15: 9.908,
16: 9.57,
17: 9.754,
18: 9.779,
19: 9.777000000000001,
20: 9.932,
'pct': 0: 0.02,
1: 0.02,
2: -0.036000000000000004,
3: -0.024,
4: -0.017,
5: 0.067,
6: -0.01,
7: -0.048,
8: 0.063,
9: 0.006999999999999999,
10: -0.009000000000000001,
11: -0.015,
12: -0.021,
13: -0.023,
14: -0.033,
15: -0.028999999999999998,
16: -0.045,
17: -0.023,
18: -0.025,
19: -0.031,
20: -0.02)
# make timestamp to make plotting easier
df['timestamp']=pd.to_datetime(df['date'])
df=df.set_index('timestamp')
# split data
df_predict = df.loc['2019-11':]
df_actual = df[~df.isin(df_predict)].dropna()
# plotly setup
fig = make_subplots(rows=2,
cols=1,
subplot_titles=('Price', 'Pct'))
# Price, actual
fig.add_trace(go.Scatter(x=df_actual.index, y=df_actual['price'],
name = "price, actual",
mode='lines',
line=dict(color='steelblue', width=2)
)
,row=1, col=1)
# Price, prediction
fig.add_trace(go.Scatter(x=df_predict.index, y=df_predict['price'],
name = "price, prediction",
mode='lines',
line=dict(color='firebrick', width=2, dash='dash')
),
row=1, col=1)
# pct actual
fig.add_trace(go.Scatter(x=df_actual.index, y=df_actual['pct'],
mode='lines',
name = "pct, actual",
line=dict(color='steelblue', width=2)
)
,row=2, col=1)
# pct prediction
fig.add_trace(go.Scatter(x=df_predict.index, y=df_predict['pct'],
name="pct, prediction",
mode='lines',
line=dict(color='firebrick', width=2, dash='dash')
),
row=2, col=1)
fig.show()
【讨论】:
对不起,它会生成ModuleNotFoundError: No module named 'plotly.subplots'
。
顺便问一下,我们可以在plotly
的行上显示值吗?
@ahbon 现在只在电话上查看。明天我会回复你的。
好的,谢谢。我将通过将pct
转换为百分比格式来更新我的问题,并且需要在图上显示pct
和price
的值。我已经尝试使用matplotlib
,它不适用于pct
的显示值。
@ahbon Plotly 几乎可以显示任何内容。但是你必须先安装它=)【参考方案2】:
如果尺寸不同,可以尝试使用子图单独打印数据。 matplotlib 网站上有关于 subplot 的文档和教程。
df = df.set_index('date')
plt.subplot(211)
plt.plot('date', 'rent_price', data=df.loc['2018-09':'2019-11'], marker='o', color='green', linewidth=2)
plt.xlabel('Observed')
plt.subplot(212)
plt.plot('date', 'rent_price', data=df.loc['2019-12':], marker='o', color='green', linewidth=2, linestyle = '--')
plt.xlabel('Predicted')
plt.show()
【讨论】:
我认为我们需要使用fig, ax1 = plt.subplots() ax2 = ax1.twinx()
。参考:***.com/questions/52126702/…
这个答案是调用 pandas 中数据框的 plot 方法。 df3.plot()
,因此,如果您这样做,则需要使用 df.plot() 并使用 ax=ax1 或 ax2。我不确定您希望它如何显示,因为日期不同,但也用于 x 轴。以上是关于使用 Python 分割数据并用实线和虚线绘制它们的主要内容,如果未能解决你的问题,请参考以下文章