Python - 从线性回归线计算正在进行的 1 个标准偏差
Posted
技术标签:
【中文标题】Python - 从线性回归线计算正在进行的 1 个标准偏差【英文标题】:Python - Calculate ongoing 1 Standard Deviation from linear regression line 【发布时间】:2017-07-04 15:24:46 【问题描述】:我已经设法获得了时间序列数据的线性回归线,这非常感谢之前的 ***。所以我有以下从 python 绘制的图/线:
我得到这条回归线的代码如下,最初是从 csv 文件中导入价格/时间序列数据:
f4 = open('C:\Users\cost9\OneDrive\Documents\PYTHON\TEST-ASSURANCE FILES\LINEAR REGRESSION MULTI TREND IDENTIFICATION\ES_1H.CSV')
ES_1H = pd.read_csv(f4)
ES_1H.rename(columns='Date/Time': 'Date', inplace=True)
ES_1H['Date'] = ES_1H['Date'].reset_index()
ES_1H.Date.values.astype('M8[D]')
ES_1H_Last_300_Periods = ES_1H[-300:]
x = ES_1H_Last_300_Periods['Date']
y = ES_1H_Last_300_Periods['Close']
x = sm.add_constant(x)
ES_1H_LR = pd.ols(y = ES_1H_Last_300_Periods['Close'], x = ES_1H_Last_300_Periods['Date'])
plt.scatter(y = ES_1H_LR.y_fitted.values, x = ES_1H_Last_300_Periods['Date'])
我正在寻找的是能够从回归线绘制/识别 1 个标准偏差(如上图所示)。上面的大部分代码只是为了使数据能够成功绘制回归线 - 更改日期/时间数据以便它可以在 ols 公式中工作,将数据截断到最后 300 个周期等等。但我不确定如何从通过线性回归绘制的线中获取 1 个标准差。
所以理想情况下,我正在寻找的应该是这样的:
...黄线与回归线相差 1 个标准差。有谁知道如何从这里的线性回归线获得 1 个标准差?作为参考,这里是线性回归的统计数据:
编辑:作为参考,这是我最终做的:
plt.scatter(y = ES_1D_LR.y_fitted.values, x = ES_1D_Last_30_Periods['Date'])
plt.scatter(y = ES_1D_Last_30_Periods.Close, x = ES_1D_Last_30_Periods.Date)
plt.scatter(y = ES_1D_LR.y_fitted.values - np.std(ES_1D_LR.y_fitted.values), x = ES_1D_Last_30_Periods.Date)
plt.scatter(y = ES_1D_LR.y_fitted.values + np.std(ES_1D_LR.y_fitted.values), x = ES_1D_Last_30_Periods.Date)
plt.show()
【问题讨论】:
【参考方案1】:我发现这种方法更接近我计划绘制回归图的方式,所以也许你也会觉得它很有趣:
使用函数“plt.fill_between”将均值和(均值+-标准差)之间的区域变灰,如下链接所示: https://jakevdp.github.io/PythonDataScienceHandbook/04.03-errorbars.html
【讨论】:
【参考方案2】:我只是想实现同样的目标。以下是我的做法。
import matplotlib.pyplot as plt
import numpy as np
鉴于此数据:
plt.plot(time, price)
plt.plot(time, predicted_price)
plt.show()
围绕predicted_price
回归线绘制一个窗口:
sq_dis = (price - predicted_price) ** 2
limit = (sq_dis.mean() + sq_dis.std()) * 0.3 # < - adjust window here
filter = np.abs(sq_dis) < limit
plt.plot(time, price)
plt.plot(time, predicted_price)
plt.plot(time[filter], price[filter])
plt.show()
【讨论】:
【参考方案3】:IIUC 你可以这样做:
In [185]: x = np.arange(100)
In [186]: y = x*0.6
In [187]: plt.scatter(x, y, c='b')
Out[187]: <matplotlib.collections.PathCollection at 0xc512390>
In [188]: plt.scatter(x, y - np.std(y), c='y')
Out[188]: <matplotlib.collections.PathCollection at 0xc683940>
In [189]: plt.scatter(x, y + np.std(y), c='y')
Out[189]: <matplotlib.collections.PathCollection at 0xc69a550>
结果:
【讨论】:
太好了,感谢类似的东西适用于我的数据。所以我绘制了类似于上面的“回归通道”,但是您知道如何在某个 x 点检索回归线的值吗?例如,在您的示例中,我正在寻找 x = 60 处的回归线的值(在您的图表中看起来大约为 35)。 @ColeStarbuck,类似这样:y[np.where(x == 60)[0][0]]
?
我目前正在使用 z = ES_1D['Date'][-1:] n = z*1.8758 + 1865.8121 例如,其中 z 获取我最后一个日期,然后 n 取截距 + z *斜率得到 2310.38,根据图表看起来是正确的。我想这是可行的,只是想验证它是否有意义以上是关于Python - 从线性回归线计算正在进行的 1 个标准偏差的主要内容,如果未能解决你的问题,请参考以下文章