股票量化交易中,如何确定高质量的历史数据

Posted whitebear

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了股票量化交易中,如何确定高质量的历史数据相关的知识,希望对你有一定的参考价值。

一、数据概述

  • 数据字段:量价数据(如开盘价、最低价、最高价、成交量、成交额、总市值等)、财务数据(如净利润TTM、现金流TTM、净资产、总资产、总负债、净利润(当季)等)、另类数据(主要是资金流入流出数据,如中户资金买入额、中户资金卖出额等)
    注:对股票量化投资来说,财务数据是非常重要的
  • 数据的排序
  • 对停牌数据的展示形式

二、是否包含退市股票
不包含退市股票,数据就是不完整,最终得到的结论就是不准确的
退市股票代表比较差的股票,如果回到早些时候,这些退市股票还未退市,又不知道这些股票未来会退市,间接地就用到了“未来函数”,会使得策略表现的“更好”

  • A股退市比例不高,但在美股、港股退市很高,需要格外注意
  • 二战时的飞机(幸存者偏差)

三、是否包含全部历史时间

  • 选股策略:一盘从06、07年开始,一是覆盖了两个牛熊周期,二是财务数据的改革
  • 择时策略:最好更早

技术图片

四、注意财务数据发布时间
从wind数据库下载的数据,比如市盈率更新过早,有可能会用到一个“未来函数”,比如,SH6000026中远海能2019年1月2日就将财报数据进行了更新,但2018年的年财报数据在2019年3月28日才公布,会导致量化投资策略的误差

  • TTM:最近12个月(Trailing Twelve Months)
    在wind数据库中,每股受益会发现是年报财务数据的数据,但当发布季度报表了,数据应该更新,但并没有更新

五、注意股票的曾用名

技术图片

股票的曾用名的用处

对股票的涨停价格很重要(连续涨停、次新股)
ST决定涨跌幅

六、如何计算股票的复权价格

技术图片

当发生除权操作时,只有对其进行计算复权价格才能继续后续的操作。
涨跌幅、前收盘价才是最重要的
前收盘价与当日的收盘价进行比较得到涨跌幅

观:刑不行《量化投资中,如何获取高质量股票历史数据》小结









以上是关于股票量化交易中,如何确定高质量的历史数据的主要内容,如果未能解决你的问题,请参考以下文章

量化交易中,如何快速把股票代码转换成Int整形?

量化交易中,如何快速把股票代码转换成Int整形?

量化交易者必看:如何获取股票和期货行情数据

量化交易如何获取实时行情数据?

股票量化交易策略之选股模拟交易过程

同花顺股票交易接口怎样执行量化挂单策略?