如何使用 expss 创建两个标题表
Posted
技术标签:
【中文标题】如何使用 expss 创建两个标题表【英文标题】:How to create two headers table with expss 【发布时间】:2020-10-12 10:51:39 【问题描述】:我一直在阅读两个标题表 here 和 here 与 expss 包,但在线代码对我不起作用。我的想法是创建一个与此图像非常相似的表格:
数据框是:
df <- data.frame(Categoria = c("gender", "gender" , "gender", "gender", "gender", "gender",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion"),
Opcoes_da_categoria = c("Mulher", "Homem", "Mulher", "Homem", "Mulher",
"Homem", "Outra religião", "Católico", "Agnóstico ou ateu",
"Evangélico", "Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico", "Outra religião",
"Católico", "Agnóstico ou ateu", "Evangélico"),
Resposta = c("A Favor", "A Favor", "Contra", "Contra", "Não sei", "Não sei",
"A Favor", "A Favor", "A Favor", "A Favor", "Contra", "Contra",
"Contra", "Contra", "Não sei", "Não sei", "Não sei", "Não sei"),
value_perc = c(65, 50, 33, 43, 2, 7, 67, 64, 56, 28, 31, 34, 35, 66, 2, 2, 10, 5))
我创建两个表头表的代码如下,但由于以下问题无法正常工作:
表格应该有两个标题 列名不应出现在表格中 该值不应包含小数library(expss)
my_table <- df %>%
tab_cells(Resposta) %>%
tab_weight(value_perc) %>%
tab_cols(Opcoes_da_categoria, Categoria) %>%
tab_stat_cpct(total_label = NULL) %>%
tab_pivot()
library(gridExtra)
png("my_table.png", height = 50*nrow(my_table), width = 200*ncol(my_table))
grid.table(my_table)
dev.off()
【问题讨论】:
不熟悉expss
,但这可以通过knitr::kable()
和kableExtra
完成。我不知道您想要的确切样式,但这是另一种选择:vignette here
我也尝试过 knitr::kable() 和 kableExtra,但它也对我不起作用。用这些包代替expss应该没问题
@polo 我最近开发了一个包,它可以自动执行与您想要实现的目标类似的操作。输出与您的图像有点不同,但您可能想检查一下here。
谢谢你,@DanChaltiel
【参考方案1】:
我不知道expss
,但最近用过flextable,感觉不错。远离这方面的专家,我设法制作了一张漂亮的桌子,它接近你想要的。
从您的 DF 开始,必须进行一些更改,以使 DF 具有您的表格所需的格式。通过提取_
之前的名称部分来重命名列名。构建了描述 col 和 header-names 依赖关系的 DF typology。 (可以在上面的链接中找到)。
然后是 flextable 部分,它先构建一个flextable
,然后应用typology
和其他格式化命令。
由此产生的结果,显示附图。
library(tidyverse)
library(flextable)
#>
#> Attache Paket: 'flextable'
#> The following object is masked from 'package:purrr':
#>
#> compose
df <- data.frame(
Categoria = c(
"gender", "gender", "gender", "gender", "gender", "gender",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion"
),
Opcoes_da_categoria = c(
"Mulher", "Homem", "Mulher", "Homem", "Mulher",
"Homem", "Outra religião", "Católico", "Agnóstico ou ateu",
"Evangélico", "Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico", "Outra religião",
"Católico", "Agnóstico ou ateu", "Evangélico"
),
Resposta = c(
"A Favor", "A Favor", "Contra", "Contra", "Não sei", "Não sei",
"A Favor", "A Favor", "A Favor", "A Favor", "Contra", "Contra",
"Contra", "Contra", "Não sei", "Não sei", "Não sei", "Não sei"
),
value_perc = c(65, 50, 33, 43, 2, 7, 67, 64, 56, 28, 31, 34, 35, 66, 2, 2, 10, 5)
)
# adjust your df to match cols and names with tidyvers
dfa <- df %>%
pivot_wider(names_from =c('Opcoes_da_categoria', 'Categoria'), values_from = 'value_perc')
nam <- str_extract(colnames(dfa),'^[^_]+')
colnames(dfa) <- nam
typology <- data.frame(
col_keys = c( "Resposta",
"Mulher", "Homem",
"Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico"),
what = c("", "Genero", "Genero", "Religio",
"Religio", "Religio", 'Religio'),
measure = c( "Resposta",
"Mulher", "Homem",
"Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico"),
stringsAsFactors = FALSE )
library(officer) # needed for making border
dftab <- flextable::flextable(dfa)
border_v = fp_border(color="gray")
dftab <- dftab %>%
set_header_df(mapping = typology, key = "col_keys" ) %>%
merge_h(part = "header") %>%
merge_v(part = "header") %>%
theme_booktabs() %>%
vline(border = border_v, j =3, part = 'body') %>%
vline(border = border_v, j =3, part = 'header')
print(dftab)
#> a flextable object.
#> col_keys: `Resposta`, `Mulher`, `Homem`, `Outra religião`, `Católico`, `Agnóstico ou ateu`, `Evangélico`
#> header has 2 row(s)
#> body has 3 row(s)
#> original dataset sample:
#> Resposta Mulher Homem Outra religião Católico Agnóstico ou ateu Evangélico
#> 1 A Favor 65 50 67 64 56 28
#> 2 Contra 33 43 31 34 35 66
#> 3 Não sei 2 7 2 2 10 5
【讨论】:
【参考方案2】:这是一个灵活的kable
解决方案,只要您可以将数据转换为宽格式,它就应该适应不同的表。希望对您有所帮助——如果您有任何问题,请告诉我!
library(dplyr)
library(tidyr)
library(knitr)
library(kableExtra)
df_wide <- df %>% # transform data to wide format, "drop" name for Resposta
pivot_wider(names_from = c(Categoria, Opcoes_da_categoria),
values_from = value_perc, names_sep = "_") %>%
rename(" " = Resposta)
cols <- sub("(.*?)_(.*)", "\\2", names(df_wide)) # grab everything after the _
grps <- sub("(.*?)_(.*)", "\\1", names(df_wide)) # grab everything before the _
df_wide %>%
kable(col.names = cols) %>%
kable_styling(c("striped"), full_width = FALSE) %>% # check out ?kable_styling for other options
add_header_above(table(grps)[unique(grps)]) # unique makes sure it is the correct order
【讨论】:
【参考方案3】:您尝试在 RStudio Data 查看器中查看表格。它将 expss 表显示为通常的 data.frames。
您可以通过设置expss_output_viewer()
在 RStudio 查看器(不是数据查看器)中查看 expss
表:
df <- data.frame(Categoria = c("gender", "gender" , "gender", "gender", "gender", "gender",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion"),
Opcoes_da_categoria = c("Mulher", "Homem", "Mulher", "Homem", "Mulher",
"Homem", "Outra religião", "Católico", "Agnóstico ou ateu",
"Evangélico", "Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico", "Outra religião",
"Católico", "Agnóstico ou ateu", "Evangélico"),
Resposta = c("A Favor", "A Favor", "Contra", "Contra", "Não sei", "Não sei",
"A Favor", "A Favor", "A Favor", "A Favor", "Contra", "Contra",
"Contra", "Contra", "Não sei", "Não sei", "Não sei", "Não sei"),
value_perc = c(65, 50, 33, 43, 2, 7, 67, 64, 56, 28, 31, 34, 35, 66, 2, 2, 10, 5))
library(expss)
my_table <- df %>%
tab_cells(Resposta) %>%
tab_weight(value_perc) %>%
tab_cols(Opcoes_da_categoria, Categoria) %>%
tab_stat_cpct(total_label = NULL) %>%
tab_pivot()
expss_digits(0) # turn off decimal digits
expss_output_viewer() # turn on displaying tables in the viewer
my_table
expss_output_default() # turn off displaying tables in the viewer
此代码给出以下结果:
如果您真的想在数据查看器中显示表格,您可以将表格转换为通常的 data.frame。有一个特殊的命令 - split_table_to_df
:
View(split_table_to_df(my_table))
结果:
更新:
df <- data.frame(Categoria = c("gender", "gender" , "gender", "gender", "gender", "gender",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion", "religion", "religion", "religion",
"religion", "religion"),
Opcoes_da_categoria = c("Mulher", "Homem", "Mulher", "Homem", "Mulher",
"Homem", "Outra religião", "Católico", "Agnóstico ou ateu",
"Evangélico", "Outra religião", "Católico",
"Agnóstico ou ateu", "Evangélico", "Outra religião",
"Católico", "Agnóstico ou ateu", "Evangélico"),
Resposta = c("A Favor", "A Favor", "Contra", "Contra", "Não sei", "Não sei",
"A Favor", "A Favor", "A Favor", "A Favor", "Contra", "Contra",
"Contra", "Contra", "Não sei", "Não sei", "Não sei", "Não sei"),
value_perc = c(65, 50, 33, 43, 2, 7, 67, 64, 56, 28, 31, 34, 35, 66, 2, 2, 10, 5))
library(expss)
my_table <- df %>%
apply_labels(
Resposta = "",
Opcoes_da_categoria = "",
Categoria = ""
) %>%
tab_cells(Resposta) %>%
tab_weight(value_perc) %>%
tab_cols(Categoria, Opcoes_da_categoria) %>%
tab_stat_cpct(total_row_position = "none") %>%
tab_pivot()
expss_digits(0) # turn off decimal digits
View(my_table)
【讨论】:
感谢 Gregory Demin 的回答,但我的问题是列名(Opcoes_da_categoria 和 Categoria)不应出现在表中。该表应该有两个标题(类别列的文本,然后是 Opcoes_da_categoria 的文本)。所以“性别”和“宗教”应该是第一位的......我怎样才能删除“#Total cases”行?以上是关于如何使用 expss 创建两个标题表的主要内容,如果未能解决你的问题,请参考以下文章