基于时间加权svm的指数优化复制策略

Posted shenliao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于时间加权svm的指数优化复制策略相关的知识,希望对你有一定的参考价值。

1 引言

  指数追踪,利用某些金融资产组合去追踪某一股票指数,指数型基金核心技术。  目前主要有两种指数复制方法 基于两种假设 一:历史能够重演,在过去一段时间能构造历史追踪误差最小的,未来也将是最优,现在大多数指数复制类型为此类。二:从统计角度,找到与目标指数具有最大相关 具有协整关系的股票组合,保证未来表现与未来尽可能一致。

  从股票数量复制角度,分为两种,完全复制和不完全复制,完全复制按照指数构造方式购买成分证券,但市场时序上变化迅速,造成成本高,逐渐不被使用。不完全复制根据优化方法寻找成分证券及其投资权重。

2模型

 先引入模型变量

技术分享图片

    模型的构建:

 

技术分享图片

 

至此,我们就可以得到了如下的一个回归问题 

 

技术分享图片

w(it)表示第i支股票t时刻的权重,如果将其处理为与时间有关的,则此线性回归问题将变得非常复杂,难以处理,为对此优化,我们采用固定比率策略,即w(it)=w(i)。这样有两个好处,一,从策略角度,为一个追涨杀跌策略,保证组合的流动性。二,模型简化为一个二次规划问题,能够很容易的求解。

  至此,将指数追踪转为了一个多元线性回归问题。

传统线性回归方法为最小二乘回归,将损失函数选择为均方误差:

                                     技术分享图片                                                                           (*)

 

(*)式表示了学习过程的经验风险,传统理论认为,经验风险最小,即模型未来预测能力越强,但现在考虑过拟合情况,使用传统机器学习中的svm,其具有较好泛化能力,采用结构风险最小策略,即参数量越少越好,同时参数越接近0越好,重新定义我们的损失函数:

                                 技术分享图片

其中ε为松弛变量,是一个接近于0但大于0的数,它的大小控制了svm中支持向量的个数,为一个超参数,需要人手工设计。

现在我们的目标函数即为:

                                     技术分享图片

最小化第一项,代表最小化结构风险,同时能代表svm中的间隔最大化,即有最好的预测能力;最小化第二项表示最小化经验损失,其中 λ为不同时期的经验损失的权重,金融中,越接近现在的,认为其含有较多未来信息,需要对现在的经验损失提高权重,为此我们采用基于指数加权方式来计算 λ 

                                     技术分享图片

其中α同样为一个超参数,需要人为设计,再次,我们设定为1。

 

至此我们的目标函数已经建立起来,接下来,就是对约束条件的讨论:

自然有的两个边界为资本预算以及投资比例:  

                                        技术分享图片            技术分享图片

 

从管理方面需要考虑股票的数目,数目越大,管理成本和难度越大,同样选取一个超参数k,其代表投资组合内最大股票种类

                                 技术分享图片  

同时限制 z 为0 1变量,为0即不进入组合,为1即进入组合。

以上讨论了约束条件和目标函数,最终我们得到了我们的指数复制模型:

                                                                                   技术分享图片

3 实验验证

 

                        技术分享图片

                       技术分享图片

从鲁棒性和样本外追踪效果来看,优于Ruiz-Torrubiano模型

4 思考与探索

一,借助于svm中松弛变量以及支持向量的思想,进一步提高了模型泛化性能;

二,时间加权,更加准确

想法:

1 svm中更为强大的是核技巧,怎么将核函数应用于其中,去更好的提高泛化能力

2 模型中有几个需要人为去指定和设计的超参数,依赖于人的经验,如何去智能调参,可能参考现在深度学习的重要方向 元学习 对其的经验损失中的超参数 怎么类比到深度学习中的正则化项

3指数复制中一个重要问题为基金按模型执行策略时,自身参加到了市场中,自己也对市场产生了影响,如同得到了解析解,但实际计算数值解时,发现其数据有噪声,导致数值解不稳定,最终成为了一个不适当问题,如何将这种行为考虑进入模型中,可以参考一下我之前讲解的GNN的思想,通过寻找稳定解去解决一部分问题

4不同时期,市场有着不同风格,可以认为数据不是同种分布,而机器学习模型都假设数据有着同一分布,可以将市场分割为不同周期,每个周期有着不同的参数,以往数据更多是去验证模型的优越性,而模型参数更多依赖于近期数据。

 

 

以上就是我对徐凤敏教授《基于时间加权svm指数复制模型和实证分析》的浅解,期望做她的研究生,做更深一步的研究!!

 

以上是关于基于时间加权svm的指数优化复制策略的主要内容,如果未能解决你的问题,请参考以下文章

优化算法之指数加权平均详解

指数加权平均动量梯度下降法RMSpropAdam优化算法

指数加权平均动量梯度下降法RMSpropAdam优化算法

基金学习20190802

指数基金介绍专栏:指数基金的加权方式,你都知道哪些?

指数加权平均数