R语言-数据分析(第1期)日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

Posted 学术无界

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言-数据分析(第1期)日数据(比如股价,气温等)好,但是信息量太密集,怎么办?相关的知识,希望对你有一定的参考价值。





目录

0.问题导入

1.示例数据

2.数据导入

3.日数据转月均数据(文末附转换函数daily2monthly)

4.日序列趋势提取(函数附于文末 daily_trend)

5.本文小结

6.本文所使用的软件包,没有需要安装

7.daily2monthly函数

8.daily_trend函数


0. 问题导入


我们有时候会拿到一些日数据,比如日气温数据(中国气象信息网),股票价格数据等,但是日间变化太小,数据点离得太近,数据序列长度短还好说,但是当它变长了的时候,往往是这个鬼样子(图1):

图1

就好像一团乱麻,完全无从下手,有没有!


那今天本篇就跟大家说说如何从日数据中挖出点东西~


1. 示例数据


今天我们用1960~2012年单点日气温数据与京东的近五年的日股价数据来进行示例说明。


数据获取:关注学术无界回复“R数据第一期”



2. 数据导入


导入气温数据

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

导入京东闭市股价数据

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

日数据可视化(图2):

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

图2

如果说长序列日数据信息量过于密集,那么将其转化为月均序列便是一种减少信息量的方法之一。但是如何做呢?请看第三节~

3. 日数据转月均数据(文末附转换函数daily2monthly)


特别说明下,文末所附转换函数需要在Rstudio 中source后才能使用


【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

daily2monthly(index, start_date = '1960-08-01',end_date = '2012-07-01')函数:
输入项:

  • index,日时间序列

  • start_date,日时间序列的起始日期

  • end_date, 日时间序列的终止日期


日数据转月均数据

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

月数据可视化(图3):

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

图3

通过对比图2与图3,我们可以发现通过将日数据序列转化月数据序列后,气温及股价时间序列明显变得更加平滑。但是对比气温与股价的月数据,我们可以发现将日数据转化为月数据这种方式对于长时间序列的日数据显然无法起到明显的信息提取的作用。


那么,当我们在处理长时间序列数据的时候我们应该如何处理呢,请阅读第4节~


4. 日序列趋势提取(函数附于文末 daily_trend)


daily_trend(df, start_year = 1960)


  • df: 日序列矩阵,共两列,第一列为date,第二列为指标列,如:

  • start_year, 数据序列起始年份,numeric

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

日数据序列趋势项提取

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

日数据序列趋势项可视化(图4):

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

图4

通过对比图3-4,我们可以发现,长时间序列的日数据通过趋势项提取后,可显著体现出其在时间尺度的变化规律。


5. 总结


本篇主要解决了三个问题:


  • 如何将日时间序列数据转化为月尺度数据?

  • 如何从日时间序列数据中提取趋势项?

  • 如何从日时间序列数据中挖掘规律?


6. 本文所使用的软件包没有需要安装


【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

7. daily2monthly函数


【R语言-数据分析(第1期)】日数据(比如股价,气温等)好,但是信息量太密集,怎么办?

8. daily_trend函数




资源仅供学术交流使用,不得用于商业用途!

如有侵权,请联系小编微信wangxueransea

推文期数:2020001

素材来源:简书用户TroyShen(作者微信:troyshen123)

责任编辑:王雪然 曾要忠

推文审核:骆丹云 林晓峰

总审核:学术无界顾问团

下期预告:就业招聘|硕博招聘信息五十四

往期回顾:





以上是关于R语言-数据分析(第1期)日数据(比如股价,气温等)好,但是信息量太密集,怎么办?的主要内容,如果未能解决你的问题,请参考以下文章

全国第7期R语言数据分析实战技术学习班

R语言-以表格显示分区统计

C 语言第二课----数据类型常量变量

R语言-数据分析(第2期)如何在时空尺度展示各省份的兴趣数据?

R与金钱游戏:均线黄金交叉2

Perl语言入门和实例讲解学习班第1期