DL炒股算法!
Posted Wang_AI
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了DL炒股算法!相关的知识,希望对你有一定的参考价值。
kaggle竞赛宝典论文学习
作者:文章摘自AAAI21,译者一元
AI圈最新DL炒股算法!
简介
最近看到一篇非常有意思的文章,分享给对机器学习做量化感兴趣的朋友。
量化交易和投资决策是复杂的金融任务,依赖于准确的股票选择。目前深度学习学习的策略使用于股票的问题的方案面临两个重大局限。
他们不直接优化利润方面的投资目标;
将每只股票视为独立于其他股票,忽略了相关股票之间的丰富信号股票价格变动。
本文基于该局限性,将股票预测重新表述为一个学习排序问题,并提出了STHAN-SR,一种用于股票选择的神经超图结构,从而定制一种新的时空注意超图网络结构,
通过联合建模股票相互依赖性及其价格的时间演变,根据利润对股票进行排序。
在三个市场上进行为期六年的实验,我们发现STHAN-SR显著优于最先进的神经股票预测方法。我们通过对STHAN-SR的空间和时间组件进行烧蚀和探索性分析来验证我们的设计选择,并证明其实用性。
背景知识
目前深度学习用于股票投资的策略,存在两大问题:
1. 问题1
并不是直接对投资收益进行优化;
- 之所以出现这种差距,是因为股票预测通常是作为一项分类任务来预测股票走势(价格上涨、下跌或无重大变化)或作为一项回归任务来预测股票价格,而不是选择预期利润最大的股票 。
- 但是高的预测性能并不总是导致股票的最有利可图的选择。此类分类和回归优化的目的是为了提高价格变动的准确性或最小化预测股票收益的误差,而不一定是为了直接获得利润。
- 这一差距暗示了优化预测性能和优化股票选择以实现利润最大化之间的差距,并引导我们思考股票选择的新方向,即预测性能和预期利润共同直接优化。
2. 问题2
将股票价格的波动认为是相互独立的,或者利用一个过度简化的股票市场模型,用一个由单个股票之间的成对关系组成的图,但实际上,这与真实的市场函数相反。
股票是相互关联的,在股票之间复杂的高阶关系中存在着丰富的信号;
可用的公司信息可用于识别可能影响其他股票价格的股票之间的联系,例如具有相同CEO或属于相同行业的股票。
如下图所示:最近的C2019冠状病毒疾病爆发,我们观察到,属于旅行和运输等行业的公司股价下跌,而与医疗保健相关股票的股价上涨相反。
本文工作
我们将股票预测表述为一个LTR问题,我们的模型直接针对盈利股票的排名进行优化。基于领域知识,我们将股票之间的高阶相互依存关系建模为使用三种不同类型的股票关系构建的超图。STHAN-SR:: Spatio Temporal Hypergraph Attention Network,STHAN-SR在利润:回报率、风险调整方面均显著优于最新方法。
01
金融中的传统模型
股票走势预测通常表述为回归和分类问题。传统金融模型侧重于技术分析,只依赖数字特征。
基于有效市场假说的较新模型被归类为基本面分析,并考虑了金融新闻、社交媒体等数字因素以外的股票影响因素。尽管这些模型取得了成功,这些方法的一个局限性是,它们假设股票运动彼此独立,这妨碍了它们学习相关股票研究潜在模式的能力。第二个主要限制是,以前的工作没有直接优化利润最大化,因为它们没有明确选择预期收入最高的顶级股票.
02
现代方法
一项新的围绕使用基于图形的方法来表示股票之间的成对关系展开,使用元数据,例如:
股票行业数据和公司CEO之间的链接(Sawhney et al.2020a);
(Kim et al.2019)提出了一种基于注意的图形神经网络用于股票运动预测。
他们表明,并非所有股票都具有同等的相关性,而且通常将大量成对股票关系分解会增加股票图中的噪声,从而降低预测性能。类似地,(Feng等人,2019b)用时间卷积扩充图卷积网络(GCN),并证明用股票间关系扩充时间股价演化方法的实用性。尽管在基于图形的股票运动预测方面取得了这些进步,但现有模型的一个简化之处是,它们假设股票以成对方式相关。以这种方式对本质上更好地表示为超图的股票数据进行分解会导致重要的高阶关系信息丢失。
03
Hypergraph表示学习
超图学习由于能够从高阶关系中提取模式(Feng等人,2019c)。最近的工作(Zhang、Zou和Ma 2019)表明,由于信息丢失,将高阶关系分解为一组成对关系的传统方法表现不佳,而最近的方法,如深度超网络嵌入(Tu等人,2018)仅限于固定长度的超边,导致泛化性差。
方法
01
问题定义
我们将股票预测定义为一个LTR的问题,另:
表示N只股票,对于第交易日的,有一个收盘价以及一个一日的回报率,,则在第个交易日,存在一个最优的ranking, ,对任意两个股票,存在一个排序,
这样对于每一天,我们都有一个排序的列表,排序越高的股票在第天对应的收益率就会越高,我们的目标是希望在每天对应的每个股票的排序预测的愈加准确。
02
模型框架
1. 股票价格时间演变
历史股价已被证明是未来股票趋势的有力指标(Jeanblanc、Yor和Chesney,2009年),并在金融文献中广泛使用(Li等人,2020年;Kim等人,2019年)。我们使用前T个交易日的历史价格信息作为STHAN-SR的输入特征。
我们计算每只股票的五个时间特征、1天收益率、5、10、20和30天移动平均数,它们代表每日、每周和每月的趋势。
对于每只股票,我们将这些时间特征连接起来,形成一个股票价格特征向量。然后,我们使用LSTM来捕获股票的特征, 我们将每日的股票价格特征输入模型获取每个股票的隐藏状态,
其中表示隐藏状态的维度。
2. 时间Attention
研究表明,每天的股票走势对未来价格有不同的影响。为此,我们采用了时间注意机制学会权衡影响未来价格的关键日期。这种机制聚集了时间隐藏状态, 对于每天,
其中是线性转换,表示学习到的attention权重。
3. Hawkes Attention
Hawkes过程是一个时间点计数过程,它模拟了一段时间内事件到达的序列。每一个事件都“激发”了这一过程,因为随后到达的机会会增加一段时间。
在股票市场中,诸如盈利通知单的发布、危机情况等事件会影响未来价格,并且这种影响会随着时间的推移而衰减。
此处我们提出一种时间Hawkes注意机制,该机制通过使用霍克斯过程来增强时间注意机制,同时聚集日级潜在表征。该注意机制学习对应于日的激发参数和衰减参数来学习该诱发excitement的衰减率。对于每种股票,我们计算时间特征为:
是当前和过去天的时间差,我们将所有的股票特征进行拼接得到
4. 空间股票超图特征抽取
股票超图构建
此处通过超图对股票的关系建模,我们构建图, 其中每个点,表示一个股票,每个边表示一个相关股票的子集。每个超边被赋予一个正的权重,我们将领域知识用来构建超边(基于工业和wiki企业关系).
Industry Hyperedges: 根据行业表现,属于同一行业的股票总体价格趋势相似。为了利用这一信号,我们根据GICS标准定义了股票之间的关系。我们构造了一个超边 连接属于同一行业的股票。
Wiki Corporate Hyperedges:此处我们考虑两种公司关系。
一阶关系:,其中表示股票和在wikidata中的实体关系;
二阶关系:,其中表示两个股票和的链接;
我们将这些关系,构建得到关联矩阵,, 定义为:
每个节点的变可以通过函数获得,并存在矩阵,
5. 超图卷积
为了学习股票价格移动中的相关性,我们定义超图卷积,其中输入到第个超图卷机层是一个空间股票特征$X^(l) \\in \\mathcalR^V|*F^l ,其中F^l是空间特征的维度。空间特征X^l变换到新的特征X^l+1 \\in \\mathcalR^V|*F^l+1$, 此处我们定义超图Laplacian为:
其中是一个可以学习的矩阵,ELU是指数线性激活,我们令
6. 超图Attention
7. LTR和网络优化
我们使用两个超图卷积,带有ELU激活函数的(),我们将股票时间特征输入到STHAN-SR的第一层, STHAN-SR的最后一层输出预测股票的ranking, ,
和时第一和第二层的参数矩阵,
我们使用逐点回归和pairwise的排名感知损失来组合优化STHAN-SR,以最小化预测和实际回报率之间的差异,同时保持具有较高预期投资回报的排名靠前股票的相对顺序,如下所示:
实验
小结
本篇文章 我们将股票预测转化为一种学习,通过基于领域知识的超图对问题进行排序和建模。我们提出了STHAN-SR,一种用于股票预测的神经超图模型。我们提出了时间霍克斯注意,并用空间超图卷积和注意来补充它,以捕获股票市场中的时空依赖性。STHAN-SR在六年内的三个全球市场的利润显著优于最先进的方法。通过烧蚀和定性实验,我们探讨了STHAN-SR的有效性,并阐述了其在算法交易中的实际适用性。我们提出的模型可以推广到跨不同领域问题的超图时空学习,如流量预测和基于会话的推荐系统。在未来,我们的目标是探索时间演化超图,以捕捉动态市场相关性,并纳入在线新闻和社交媒体等其他数据源。
觉得还不错就给我一个小小的鼓励吧!
以上是关于DL炒股算法!的主要内容,如果未能解决你的问题,请参考以下文章