循环遍历 Rmarkdown 中的分组 id 列并呈现 PDF
Posted
技术标签:
【中文标题】循环遍历 Rmarkdown 中的分组 id 列并呈现 PDF【英文标题】:Loop over grouped id column in Rmarkdown and render PDF 【发布时间】:2022-01-22 13:04:18 【问题描述】:我在数据集中有 2 列:id 和 text
同一个 id 存在多个文本。我的目标是通过遍历 ID 号生成多个 PDF 文件(每个 ID 一个)。但是,我希望每个 pdf 都包含 ALL 该 ID 号的文本(使用 knitr::kable()
的表格格式)
这是我拥有的 .Rmd 文件的可重现示例:
---
title: "Loop over grouped IDs"
output:
pdf_document:
latex_engine: xelatex
params:
id: i
---
```r setup, include=FALSE
knitr::opts_chunk$set(echo = TRUE, include= FALSE)
library(tidyverse)
df <- tibble(
text = c(
"text one for id#1",
"text two for id#1",
"text one for id#12",
"text one for id#13",
"text two for id#13",
"text three for id#13",
"text one for id#15",
"text two for id#15"
),
id = c(1, 1, 12, 13, 13, 13, 15, 15)
)
df_id_filtered <- df %>% filter(id == params$id)
```
## Hello ID\#`r df_id$id[i]`!
These are the collections of texts that belong to you
```r, echo=FALSE, results='asis'
texts <- df_id_filtered$text
table <- knitr::kable(texts, col.names = "text")
```
`r table`
我为循环代码创建了一个 .R 脚本,如下所示:
library(rmarkdown)
library(knitr)
# loop through the id rows in the filtered data frame and generate a pdf report for each ID with all the texts in the "text" column for that ID
for (i in seq_along(df_id_filtered))
rmarkdown::render(input = "idText.Rmd",
params = list(id = i),
output_format = "pdf_document",
output_file = paste0("File", "_", "ID#", i, ".pdf"))
循环是如何准确链接到params: id
的?
如果我遍历整个 df
而不是 df_id_filtered
,那么相同 ID 号的文本将位于单独的文件中。
seq_along()
是这里的正确选择吗? params = list()
应该是什么?
我的代码有效,但它不能针对整个唯一 ID 运行(仅针对其中 2 个)。
非常感谢任何帮助!谢谢!
【问题讨论】:
【参考方案1】:如果您想遍历所有ID
,我认为seq_along(df_id_filtered)
不是正确的选择。 df_id_filtered
是数据框,seq_along
将遍历列。由于您的数据中有 2 列,因此它仅针对 2 个 ID 运行。
你可以试试——
library(rmarkdown)
library(knitr)
for (i in unique(df$id))
rmarkdown::render(input = "idText.Rmd",
params = list(id = i),
output_format = "pdf_document",
output_file = paste0("File", "_", "ID#", i, ".pdf"))
所以这里我们循环遍历数据中的每个unique
id
,并为它写一个pdf。
【讨论】:
谢谢!这有效!快速提问,在params = list()
中,我看到人们使用id = id
而不是id = i
。有什么区别?
嗯,这些只是循环的变量,它可以是任何东西。如果您将for
循环更改为for(id in unique(df$id)) ...
,您可以使用params = list(id = id)
。以上是关于循环遍历 Rmarkdown 中的分组 id 列并呈现 PDF的主要内容,如果未能解决你的问题,请参考以下文章