Python 机器学习使用多个股票数据集

Posted

技术标签:

【中文标题】Python 机器学习使用多个股票数据集【英文标题】:Python Machine learning use multiple stock datasets 【发布时间】:2021-05-04 20:48:11 【问题描述】:

首先我想说我是机器学习的新手,所以希望你能帮助我。我想预测股票价格使用机器学习,它适用于我使用 this 教程。为了获得比this更准确,我认为这可能有助于使用更多数据。

现在我有更多包含来自其他股票和其他公司的数据的 CSV 文件,现在我的问题是,我可以使用来自不同股票的文件来获得更准确的数据以及如何强>我能做到吗?

Here is 一个 *** 问题描述了我的问题,但答案对我没有帮助。它说在合并后对数据进行规范化。但是我不明白组合数据集有什么意义,因为当我只是将 CSV 文件相互添加时,模型不知道哪些数据是针对哪个 Ticker 的。我希望你能理解我的问题并帮助我。


这是我认为相关的代码:


df = pd.read_csv(r'aapl_data.csv')
df = df[['close']]

# Create variable to predict 'x' days out the future
future_days = 25
# Create a column (target) shifted 'x' days up
df['Prediction'] = df['close'].shift(-future_days)

# Create feature data set, convert it to numpy array and remove last 'x' rows/days
X = np.array(df.drop(['Prediction'], 1))[:-future_days]
# Create target data set (y), convert it to numpy array get all of the target values except the last 'x' rows/days
y = np.array(df['Prediction'])[:-future_days]

# Split the data to 75% training and 25% testing
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.25)

x_train = np.nan_to_num(x_train)
y_train = np.nan_to_num(y_train)
tree = DecisionTreeRegressor().fit(x_train, y_train)

PS:你也会帮助我,在需要时更改标题或告诉我我必须谷歌找到答案,因为我不认为我是第一个有这个想法的人,但我不知道这是怎么回事“问题”被调用。

感谢您的帮助!

【问题讨论】:

【参考方案1】:

您可以尝试使用每个新的股票数据集继续训练相同的模型。只需在每次训练后保存您的模型。这是我的建议,不一定是正确的答案。

【讨论】:

正如目前所写,您的答案尚不清楚。请edit 添加其他详细信息,以帮助其他人了解这如何解决所提出的问题。你可以找到更多关于如何写好答案的信息in the help center。

以上是关于Python 机器学习使用多个股票数据集的主要内容,如果未能解决你的问题,请参考以下文章

火炉炼AI机器学习045-对股票数据进行隐马尔科夫建模

自创数据集,使用TensorFlow预测股票入门

股票实战--线性回归

机器学习Pandas库练习-获取yahoo金融苹果公司的股票数据

小白必看的经典机器学习入门项目

R语言使用机器学习算法预测股票市场