基于时间加权svm的指数优化复制策略

Posted 2020-11-09 shenliao

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了基于时间加权svm的指数优化复制策略相关的知识，希望对你有一定的参考价值。

1 引言

指数追踪，利用某些金融资产组合去追踪某一股票指数，指数型基金核心技术。目前主要有两种指数复制方法基于两种假设一：历史能够重演，在过去一段时间能构造历史追踪误差最小的，未来也将是最优，现在大多数指数复制类型为此类。二：从统计角度，找到与目标指数具有最大相关具有协整关系的股票组合，保证未来表现与未来尽可能一致。

从股票数量复制角度，分为两种，完全复制和不完全复制，完全复制按照指数构造方式购买成分证券，但市场时序上变化迅速，造成成本高，逐渐不被使用。不完全复制根据优化方法寻找成分证券及其投资权重。

2模型

先引入模型变量

：技术分享图片

模型的构建：

技术分享图片

至此，我们就可以得到了如下的一个回归问题

技术分享图片

w（it）表示第i支股票t时刻的权重，如果将其处理为与时间有关的，则此线性回归问题将变得非常复杂，难以处理，为对此优化，我们采用固定比率策略，即w（it）=w（i）。这样有两个好处，一，从策略角度，为一个追涨杀跌策略，保证组合的流动性。二，模型简化为一个二次规划问题，能够很容易的求解。

至此，将指数追踪转为了一个多元线性回归问题。

传统线性回归方法为最小二乘回归，将损失函数选择为均方误差：

技术分享图片（*）

（*）式表示了学习过程的经验风险，传统理论认为，经验风险最小，即模型未来预测能力越强，但现在考虑过拟合情况，使用传统机器学习中的svm，其具有较好泛化能力，采用结构风险最小策略，即参数量越少越好，同时参数越接近0越好，重新定义我们的损失函数：

技术分享图片

其中ε为松弛变量，是一个接近于0但大于0的数，它的大小控制了svm中支持向量的个数，为一个超参数，需要人手工设计。

现在我们的目标函数即为：

技术分享图片

最小化第一项，代表最小化结构风险，同时能代表svm中的间隔最大化，即有最好的预测能力；最小化第二项表示最小化经验损失，其中 λ为不同时期的经验损失的权重，金融中，越接近现在的，认为其含有较多未来信息，需要对现在的经验损失提高权重，为此我们采用基于指数加权方式来计算 λ

技术分享图片

其中α同样为一个超参数，需要人为设计，再次，我们设定为1。

至此我们的目标函数已经建立起来，接下来，就是对约束条件的讨论：

自然有的两个边界为资本预算以及投资比例：

技术分享图片

从管理方面需要考虑股票的数目，数目越大，管理成本和难度越大，同样选取一个超参数k，其代表投资组合内最大股票种类

技术分享图片

同时限制 z 为0 1变量，为0即不进入组合，为1即进入组合。

以上讨论了约束条件和目标函数，最终我们得到了我们的指数复制模型：

技术分享图片

3 实验验证

技术分享图片

技术分享图片

从鲁棒性和样本外追踪效果来看，优于Ruiz-Torrubiano模型

4 思考与探索

一，借助于svm中松弛变量以及支持向量的思想，进一步提高了模型泛化性能；

二，时间加权，更加准确

想法：

1 svm中更为强大的是核技巧，怎么将核函数应用于其中，去更好的提高泛化能力

2 模型中有几个需要人为去指定和设计的超参数，依赖于人的经验，如何去智能调参，可能参考现在深度学习的重要方向元学习对其的经验损失中的超参数怎么类比到深度学习中的正则化项

3指数复制中一个重要问题为基金按模型执行策略时，自身参加到了市场中，自己也对市场产生了影响，如同得到了解析解，但实际计算数值解时，发现其数据有噪声，导致数值解不稳定，最终成为了一个不适当问题，如何将这种行为考虑进入模型中，可以参考一下我之前讲解的GNN的思想，通过寻找稳定解去解决一部分问题

4不同时期，市场有着不同风格，可以认为数据不是同种分布，而机器学习模型都假设数据有着同一分布，可以将市场分割为不同周期，每个周期有着不同的参数，以往数据更多是去验证模型的优越性，而模型参数更多依赖于近期数据。

以上就是我对徐凤敏教授《基于时间加权svm指数复制模型和实证分析》的浅解，期望做她的研究生，做更深一步的研究！！

以上是关于基于时间加权svm的指数优化复制策略的主要内容，如果未能解决你的问题，请参考以下文章

优化算法之指数加权平均详解

指数加权平均动量梯度下降法RMSpropAdam优化算法

指数加权平均动量梯度下降法RMSpropAdam优化算法

基金学习20190802

指数基金介绍专栏：指数基金的加权方式，你都知道哪些？

指数加权平均数