如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?

Posted

技术标签:

【中文标题】如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?【英文标题】:How can I filter pre-aggregated data in Rmarkdown without Shiny? 【发布时间】:2022-01-18 00:42:03 【问题描述】:

原始问题

(请参阅下面的部分解决方案更新。)

我有一个 RMarkdown 文档,它按组总结了有多少记录(行)具有各种属性。我希望能够通过在汇总之前进行过滤来操纵表中包含哪些记录。我在下面创建了一个最小但类似的模型。

我想要的是一个交互式复选框,可以有效地“注释或取消注释”一行

  # filter(weight_class == "Heavy") %>% 

下面。

我知道我可以用 Shiny 做到这一点,但我需要能够直接与同事共享生成的 html 文件(在我的例子中是通过共享 Box 文件夹),所以 Shiny 解决方案不可行,至少目前是这样.另外,我考虑过使用DT/datatable 的功能,但据我所知,过滤需要在它到达那里之前进行(尽管我愿意被证明我错了) .

我见过像 htmltoolshtmlwidgetscrosstalk 这样的软件包,它们似乎可以促进这一点,但我对它们还不够熟悉,似乎无法在网上找到足够接近的示例为我的目的进行修改。

实际上,我希望能够过滤多个条件,并希望从过滤后的数据中生成多个表格和绘图,但我希望下面的最小示例可以作为一个可行的起点。

我怎样才能添加这样一个复选框(或类似的)来创建这种类型的交互而不求助于 Shiny?

演示 RMarkdown:

---
title: "Table Demo"
output: html_document
---

```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```

```r data
set.seed(42)
df <- tibble(
  group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
  weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
  is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```

```r table
df %>% 
  # filter(weight_class == "Heavy") %>% 
  count(group, is_ready) %>% 
  pivot_wider(names_from = "is_ready", values_from = n) %>% 
  rename(Ready = `TRUE`, not_ready = `FALSE`) %>% 
  mutate(Total = Ready + not_ready, Ready_Percentage = Ready/Total) %>% 
  select(group, Ready, Total, Ready_Percentage, -not_ready) %>% 
  datatable() %>% 
  formatPercentage("Ready_Percentage")
```

生成的 HTML:

使用部分解决方案更新

我从@user2554330 的建议中得到了一个几乎可行的解决方案:

---
title: "Table Demo"
output: html_document
---

```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```

```r data
set.seed(42)
df <- tibble(
  group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
  weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
  is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```

```r solution
library(reactable)
library(crosstalk)
shared_df <- SharedData$new(df)

shared_df %>% 
  reactable(
    groupBy = "group",
    columns = list(
      is_ready = colDef(aggregate = "frequency")
    )
  ) -> tb

bscols(
  widths = c(2, 10),
  list(filter_checkbox("weight_class", "Weight Class", shared_df, ~weight_class)),
  tb
)
```

很遗憾,过滤不会影响聚合(参见屏幕截图)。

选中所有记录的屏幕截图:

仅选择了重度记录的屏幕截图:

过滤影响组计数,但不影响is_ready 频率聚合。我希望过滤也会影响此列,结果如下:

df %>% filter(weight_class == "Heavy") %>% count(group, is_ready)
#> # A tibble: 8 x 3
#>   group   is_ready     n
#>   <chr>   <lgl>    <int>
#> 1 Group A FALSE        8
#> 2 Group A TRUE         1
#> 3 Group B FALSE        7
#> 4 Group B TRUE         3
#> 5 Group C FALSE        4
#> 6 Group C TRUE         1
#> 7 Group D FALSE       11
#> 8 Group D TRUE         2

由reprex package (v1.0.0) 于 2021 年 12 月 14 日创建

我做错了什么?

【问题讨论】:

您想要一些 HTML 元素来帮助过滤数据,然后您想要根据该选择更改摘要?如果是这种情况,那么 R 不会在这里为您提供帮助。虽然datatables(html 元素)可以提供一些合理的客户端过滤,但它不会为您做总结。为此,您需要编写用户可以使用的内容,例如 javascript 您可以使用crosstalkreactable 执行此操作。这篇博文themockup.blog/posts/… 做了类似的事情。 【参考方案1】:

尝试添加一个 JS 聚合函数回调,而不是使用内置聚合:

shared_df %>% 
  reactable(
    groupBy = "group",
    columns = list(
      # is_ready = colDef(aggregate = "frequency"),
      is_ready = colDef(aggregated = JS("function(cellInfo) 
        let total_rows = cellInfo.subRows.length
        let total_ready_rows = cellInfo.subRows.filter(val => val.is_ready === true).length
        let percent = Math.round(total_ready_rows * 100 / total_rows) + '%'
        
        return percent
      "))
    )
  ) -> tb

由于某种原因,如果你使用frequency 函数,或者任何其他默认的函数,它不会被更新,但是 JS 总是使用动态数据;以后,使用 JS 函数对过滤后的数据进行聚合计算。

完整代码:

---
title: "Table Demo"
output: html_document
---

```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DT)
```

```r data
set.seed(42)
df <- tibble(
  group = sample(paste0("Group ", LETTERS[1:4]), 100, replace = T),
  weight_class = sample(c("Heavy", "Light"), 100, replace = T, prob = c(.3, .7)),
  is_ready = sample(c(TRUE, FALSE), 100, replace = T, prob = c(.4, .6))
)
```

```r solution
library(reactable)
library(crosstalk)
shared_df <- SharedData$new(df)

shared_df %>% 
  reactable(
    groupBy = "group",
    columns = list(
      # is_ready = colDef(aggregate = "frequency"),
      is_ready = colDef(aggregated = JS("function(cellInfo) 
        let total_rows = cellInfo.subRows.length
        let total_ready_rows = cellInfo.subRows.filter(val => val.is_ready === true).length
        let percent = Math.round(total_ready_rows * 100 / total_rows) + '%'
        
        return percent
      "))
    )
  ) -> tb

bscols(
  widths = c(2, 10),
  list(filter_checkbox("weight_class", "Weight Class", shared_df, ~weight_class)),
  tb
)
```

【讨论】:

以上是关于如何在没有 Shiny 的情况下过滤 Rmarkdown 中的预聚合数据?的主要内容,如果未能解决你的问题,请参考以下文章

在 WPF 中,您可以在没有代码的情况下过滤 CollectionViewSource 吗?

在没有 DOM 的情况下过滤内存中的 XML 节点?

我应该如何在不破坏嵌套的情况下过滤 RECORD 中的列?

如何在不使用 Group By / 有函数的情况下过滤 SQL 中的数据

在 Explorer 下过滤 AWS 资源

在不更改数据源的情况下过滤 DataGridView