如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?
Posted
技术标签:
【中文标题】如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?【英文标题】:How can I filter pre-aggregated data in Rmarkdown without Shiny? 【发布时间】:2022-01-18 00:42:03 【问题描述】:原始问题
(请参阅下面的部分解决方案更新。)
我有一个 RMarkdown 文档,它按组总结了有多少记录(行)具有各种属性。我希望能够通过在汇总之前进行过滤来操纵表中包含哪些记录。我在下面创建了一个最小但类似的模型。
我想要的是一个交互式复选框,可以有效地“注释或取消注释”一行
# filter(weight_class == "Heavy") %>%
下面。
我知道我可以用 Shiny 做到这一点,但我需要能够直接与同事共享生成的 html 文件(在我的例子中是通过共享 Box 文件夹),所以 Shiny 解决方案不可行,至少目前是这样.另外,我考虑过使用DT
/datatable
的功能,但据我所知,过滤需要在它到达那里之前进行(尽管我愿意被证明我错了) .
我见过像 htmltools
、htmlwidgets
和 crosstalk
这样的软件包,它们似乎可以促进这一点,但我对它们还不够熟悉,似乎无法在网上找到足够接近的示例为我的目的进行修改。
实际上,我希望能够过滤多个条件,并希望从过滤后的数据中生成多个表格和绘图,但我希望下面的最小示例可以作为一个可行的起点。
我怎样才能添加这样一个复选框(或类似的)来创建这种类型的交互而不求助于 Shiny?
演示 RMarkdown:
---
title: "Table Demo"
output: html_document
---
```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```
```r data
set.seed(42)
df <- tibble(
group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```
```r table
df %>%
# filter(weight_class == "Heavy") %>%
count(group, is_ready) %>%
pivot_wider(names_from = "is_ready", values_from = n) %>%
rename(Ready = `TRUE`, not_ready = `FALSE`) %>%
mutate(Total = Ready + not_ready, Ready_Percentage = Ready/Total) %>%
select(group, Ready, Total, Ready_Percentage, -not_ready) %>%
datatable() %>%
formatPercentage("Ready_Percentage")
```
生成的 HTML:
使用部分解决方案更新
我从@user2554330 的建议中得到了一个几乎可行的解决方案:
---
title: "Table Demo"
output: html_document
---
```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```
```r data
set.seed(42)
df <- tibble(
group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```
```r solution
library(reactable)
library(crosstalk)
shared_df <- SharedData$new(df)
shared_df %>%
reactable(
groupBy = "group",
columns = list(
is_ready = colDef(aggregate = "frequency")
)
) -> tb
bscols(
widths = c(2, 10),
list(filter_checkbox("weight_class", "Weight Class", shared_df, ~weight_class)),
tb
)
```
很遗憾,过滤不会影响聚合(参见屏幕截图)。
选中所有记录的屏幕截图:
仅选择了重度记录的屏幕截图:
过滤影响组计数,但不影响is_ready
频率聚合。我希望过滤也会影响此列,结果如下:
df %>% filter(weight_class == "Heavy") %>% count(group, is_ready)
#> # A tibble: 8 x 3
#> group is_ready n
#> <chr> <lgl> <int>
#> 1 Group A FALSE 8
#> 2 Group A TRUE 1
#> 3 Group B FALSE 7
#> 4 Group B TRUE 3
#> 5 Group C FALSE 4
#> 6 Group C TRUE 1
#> 7 Group D FALSE 11
#> 8 Group D TRUE 2
由reprex package (v1.0.0) 于 2021 年 12 月 14 日创建
我做错了什么?
【问题讨论】:
您想要一些 HTML 元素来帮助过滤数据,然后您想要根据该选择更改摘要?如果是这种情况,那么 R 不会在这里为您提供帮助。虽然datatables
(html 元素)可以提供一些合理的客户端过滤,但它不会为您做总结。为此,您需要编写用户可以使用的内容,例如 javascript。
您可以使用crosstalk
和reactable
执行此操作。这篇博文themockup.blog/posts/… 做了类似的事情。
【参考方案1】:
尝试添加一个 JS 聚合函数回调,而不是使用内置聚合:
shared_df %>%
reactable(
groupBy = "group",
columns = list(
# is_ready = colDef(aggregate = "frequency"),
is_ready = colDef(aggregated = JS("function(cellInfo)
let total_rows = cellInfo.subRows.length
let total_ready_rows = cellInfo.subRows.filter(val => val.is_ready === true).length
let percent = Math.round(total_ready_rows * 100 / total_rows) + '%'
return percent
"))
)
) -> tb
由于某种原因,如果你使用frequency
函数,或者任何其他默认的函数,它不会被更新,但是 JS 总是使用动态数据;以后,使用 JS 函数对过滤后的数据进行聚合计算。
完整代码:
---
title: "Table Demo"
output: html_document
---
```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```
```r data
set.seed(42)
df <- tibble(
group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```
```r solution
library(reactable)
library(crosstalk)
shared_df <- SharedData$new(df)
shared_df %>%
reactable(
groupBy = "group",
columns = list(
# is_ready = colDef(aggregate = "frequency"),
is_ready = colDef(aggregated = JS("function(cellInfo)
let total_rows = cellInfo.subRows.length
let total_ready_rows = cellInfo.subRows.filter(val => val.is_ready === true).length
let percent = Math.round(total_ready_rows * 100 / total_rows) + '%'
return percent
"))
)
) -> tb
bscols(
widths = c(2, 10),
list(filter_checkbox("weight_class", "Weight Class", shared_df, ~weight_class)),
tb
)
```
【讨论】:
以上是关于如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?的主要内容,如果未能解决你的问题,请参考以下文章
在 WPF 中,您可以在没有代码的情况下过滤 CollectionViewSource 吗?