在 R 中将 DFM 与 quanteda 合并

Posted

技术标签:

【中文标题】在 R 中将 DFM 与 quanteda 合并【英文标题】:Merging DFMs with quanteda in R 【发布时间】:2022-01-20 10:02:16 【问题描述】:

我对 quanteda 和 R 很陌生。他们有机会按行合并多个 DFM 吗?

我确实有至少 3 个包含多个文本的 dfm,并希望将它们合并为一个 dfm。

【问题讨论】:

请提供足够的代码,以便其他人更好地理解或重现问题。 【参考方案1】:

您可以使用rbind 将它们组合在一起。

小例子:

library(quanteda)

dfm1 <- data_corpus_inaugural %>%
  corpus_subset(Year > 1990) %>%
  tokens() %>% 
  dfm()


dfm2 <- data_corpus_inaugural %>%
  corpus_subset(Year <= 1990 & Year > 1980) %>%
  tokens() %>% 
  dfm()


dfm_combined <- rbind(dfm1, dfm2)

如果需要,如果您注意到两个 dfms 中都出现了功能或文档,您可以在之后运行 dfm_compress。通过?dfm_combined查看帮助。

【讨论】:

以上是关于在 R 中将 DFM 与 quanteda 合并的主要内容,如果未能解决你的问题,请参考以下文章

使用 quanteda 在 R 中的大型语料库上计算余弦相似度

R:将 LIME 应用于 quanteda 文本模型的问题

mysql中将多行数据合并成一行数据

r语言中怎么把两个随机变量合并成一个

如何在SPSS中将变量合并

excl中将某列数据合到单个单元格