如何在 ggplot 和 dplyr 中使用 tsibble 的 yearmonth

Posted

技术标签:

【中文标题】如何在 ggplot 和 dplyr 中使用 tsibble 的 yearmonth【英文标题】:How to work with yearmonth from tsibble in ggplot and dplyr 【发布时间】:2021-11-16 05:16:17 【问题描述】:

工作示例:

library(fpp3)

Data <- aus_retail %>%
  filter(State == "Western Australia",
         Industry == "Takeaway food services")

autoplot(Data) + xlim()

我将如何做一些事情,比如限制 x 轴或过滤数据,以便只存储 2000 年之后的日期?不确定如何使用 tsibble 的 yearmonth 变量。

谢谢!

【问题讨论】:

aus_retail 数据集来自哪个包?我在fpp3 中找不到它。 @RonakShah 它应该在tsibbledata。我的fpp3 版本是0.4.0,我的tsibbledata 版本是0.3.0,如果有帮助的话。 请提供足够的代码,以便其他人更好地理解或重现问题。 【参考方案1】:

您可以使用lubridate 中的year 函数从yearmonth 对象中提取年份并仅保留2000 年之后的数据。

library(dplyr)
library(lubridate)

tsibbledata::aus_retail %>%
  filter(State == "Western Australia",
         Industry == "Takeaway food services") %>%
  filter(year(Month) >= 2000)

#   State             Industry               `Series ID`    Month Turnover
#   <chr>             <chr>                  <chr>          <mth>    <dbl>
# 1 Western Australia Takeaway food services A3349435A   2000 Jan     61  
# 2 Western Australia Takeaway food services A3349435A   2000 Feb     56  
# 3 Western Australia Takeaway food services A3349435A   2000 Mar     61.1
# 4 Western Australia Takeaway food services A3349435A   2000 Apr     64.2
# 5 Western Australia Takeaway food services A3349435A   2000 May     65.7
# 6 Western Australia Takeaway food services A3349435A   2000 Jun     64.9
# 7 Western Australia Takeaway food services A3349435A   2000 Jul     62.6
# 8 Western Australia Takeaway food services A3349435A   2000 Aug     62.8
# 9 Western Australia Takeaway food services A3349435A   2000 Sep     62.1
#10 Western Australia Takeaway food services A3349435A   2000 Oct     66.6
# … with 218 more rows

【讨论】:

以上是关于如何在 ggplot 和 dplyr 中使用 tsibble 的 yearmonth的主要内容,如果未能解决你的问题,请参考以下文章

R语言ggplot2可视化:使用dplyr包计算每个分组个数的比例使用ggplot2可视化条形图(bar plot)并在条形图上添加百分比标签

ggplot2:在图中添加p值

R语言ggplot2可视化:使用dplyr包计算每个分组个数的比例(对计算获得的百分比进行近似,值保留整数部分)使用ggplot2可视化条形图(bar plot)并在条形图上添加百分比标签

R语言dplyr包使用group_by函数和summarise函数计算单分类变量分组均值ggplot2可视化线图(line plot)并设置线条类型为虚线(set line types)

R语言dplyr包使用group_by函数和summarise函数计算单分类变量分组均值ggplot2可视化线图(line plot)并设置线条类型为虚线(set line types)

堆积条形图,按总计(值的总和)重新排序,而不是值 ggplot2 + dplyr