Python量化交易基础之描述性分析
Posted 程序员与Python
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python量化交易基础之描述性分析相关的知识,希望对你有一定的参考价值。
金融数据分析是量化投资工作不可或缺的一环,有的投资者因为正确地分析数据而获得巨额利润,也有投资者因误判信息而错失良机,可以说正确分析经济金融数据是投资成功的一大关键。
统计分析(Statical Analysis)
统计分析是以数据为基础进行分析与推断的方法,包括以下两大部分。
- 描述统计(Descriptive Statistics)
- 推论统计(Inferential Statistics)
将数据进行整理(Organization),如排序、统计频数(又称次数)、绘制频数分布等,也可以计算指标对数据进行总结(Summarization),包括平均数、中位数、最大与最小值等,对已知数据进行整理、归类、简化或绘制图表来呈现数据特征是描述性统计主要的内容。
对于某一特定事物所有可能发生的结果形成的集合,称之为母体(Population),而其中一部分可观察到的结果则称为样本(Sample)。透过分析有限样本推测母体的特征是推论统计主要的工作内容,也是统计分析的重点所在。
抽样的方法是统计学中重要的环节,样本的好坏很大程度影响了推论统计的结果,所以抽样方法希望最大程度上保证抽取出的样本可以充分的包含母体的特征信息。常见的方法有简单抽样(Simple Random Sampling)、系统抽样(Systematic Sampling)、分层抽样(Stratified Sampling)等。
数据类型(Data Type)
定性数据(Qualitative Data)
定性数据是呈现事物性质特征的数据,如比特币与以太币属于虚拟货币、台积电(2330)与元大台湾50(0050)属于股票,那么虚拟货币与股票即为定性数据。
定量数据(Quantitative Data)
定量数据是呈现事物数量特征的数据,由不同大小的数字与单位组成,例如股票的收盘价、日涨幅、年增率等。
图表(Figure)
数据可视化是最直观了解数据特征的方法,常见的图表有以下种。
直方图
可以快速地观察数据分布情况,进阶分析可以再计算偏度(Skew)来查看资料集中情况与峰度(Kurtosis)来确定数据的常态性。
折线图
观察定量数据变化的情形,如股票收盘价。
散布图
查看二维数据彼此之间的分布情况
位置指标
描述数据的位置特性常用的指标
- 样本平均数
- 几何平均数
- 中位数
- 众数
- 百分位数
离散指标
描述数据离散程度的指标
- 全距
- 平均绝对偏差
- 变异数
- 标准偏差
欢迎想学习Python数据科学、商业分析、金融知识的人一起交流!
本内容全部都是基于「分享」的实作、理论兼顾文章,希望能够帮助到所有对数据科学领域有兴趣的人们,
若喜欢我在CSDN的内容,可以点个赞,好让我知道你喜不喜欢这篇文章:
收藏一下:签个到,表示支持(谢谢鼓励!)
关注一下:想要我多写「python数分相关」
三连一下:我有你这读者写这篇也心满意足了!
敬请期待下一篇!或是您也可以逛逛我的其他文章》》》》》》》》》
Python 3.11即将发布,这5个实用新功能,你还不知道嘛
掌握这25个单行代码技巧,你也能写出『高端』Python代码
以上是关于Python量化交易基础之描述性分析的主要内容,如果未能解决你的问题,请参考以下文章
量化资料学习《Python与量化投资从基础到实战》+《量化交易之路用Python做股票量化分析》+《组织与管理研究的实证方法第2版》