股票量化交易中,如何确定高质量的历史数据
Posted whitebear
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了股票量化交易中,如何确定高质量的历史数据相关的知识,希望对你有一定的参考价值。
一、数据概述
- 数据字段:量价数据(如开盘价、最低价、最高价、成交量、成交额、总市值等)、财务数据(如净利润TTM、现金流TTM、净资产、总资产、总负债、净利润(当季)等)、另类数据(主要是资金流入流出数据,如中户资金买入额、中户资金卖出额等)
注:对股票量化投资来说,财务数据是非常重要的 - 数据的排序
- 对停牌数据的展示形式
二、是否包含退市股票
不包含退市股票,数据就是不完整,最终得到的结论就是不准确的
退市股票代表比较差的股票,如果回到早些时候,这些退市股票还未退市,又不知道这些股票未来会退市,间接地就用到了“未来函数”,会使得策略表现的“更好”
- A股退市比例不高,但在美股、港股退市很高,需要格外注意
- 二战时的飞机(幸存者偏差)
三、是否包含全部历史时间
- 选股策略:一盘从06、07年开始,一是覆盖了两个牛熊周期,二是财务数据的改革
- 择时策略:最好更早
四、注意财务数据发布时间
从wind数据库下载的数据,比如市盈率更新过早,有可能会用到一个“未来函数”,比如,SH6000026中远海能2019年1月2日就将财报数据进行了更新,但2018年的年财报数据在2019年3月28日才公布,会导致量化投资策略的误差
- TTM:最近12个月(Trailing Twelve Months)
在wind数据库中,每股受益会发现是年报财务数据的数据,但当发布季度报表了,数据应该更新,但并没有更新
五、注意股票的曾用名
股票的曾用名的用处
对股票的涨停价格很重要(连续涨停、次新股)
ST决定涨跌幅
六、如何计算股票的复权价格
当发生除权操作时,只有对其进行计算复权价格才能继续后续的操作。
涨跌幅、前收盘价才是最重要的
前收盘价与当日的收盘价进行比较得到涨跌幅
观:刑不行《量化投资中,如何获取高质量股票历史数据》小结
以上是关于股票量化交易中,如何确定高质量的历史数据的主要内容,如果未能解决你的问题,请参考以下文章