R unnest_tokens 列表中的元素

Posted

技术标签:

【中文标题】R unnest_tokens 列表中的元素【英文标题】:R unnest_tokens elements from list 【发布时间】:2020-04-12 11:50:47 【问题描述】:

我有这个:

library(tidytext)
list_chars <- list("you and I", "he or she", "we and they")
list_chars_as_tibble <- lapply(list_chars, tibble)
list_chars_by_word <- lapply(list_chars_as_tibble, unnest_tokens)

知道了:

Error in check_input(x) : 
  Input must be a character vector of any length or a list of character
  vectors, each of which has a length of 1.

想要得到这个:

[[1]]
1 you
2 and
3 I

[[2]]
1 he
2 or
3 she

[[3]]
1 we
2 and
3 they

请帮忙,我相信我已经尝试了所有方法,但显然没有,谢谢

【问题讨论】:

【参考方案1】:

unnest_tokens() 需要被告知要解析哪一列,因此您需要在小标题中命名字符列:

library(tidytext)
library(tibble)

list_chars_as_tibble <- lapply(list_chars, function(x) tibble(txt = x))
lapply(list_chars_as_tibble, unnest_tokens, word, txt)

[[1]]
# A tibble: 3 x 1
  word 
  <chr>
1 you  
2 and  
3 i    

[[2]]
# A tibble: 3 x 1
  word 
  <chr>
1 he   
2 or   
3 she  

[[3]]
# A tibble: 3 x 1
  word 
  <chr>
1 we   
2 and  
3 they 

【讨论】:

感谢 H 1,它就像一个魅力,我在哪里可以学到这样的东西?我在哪里可以结束这个问题? 谢谢......我没有看到关闭这篇文章的“勾号”......我只有三个方框,旁边是“活跃”、“最旧”、“投票” ",我点击了投票但什么也没有

以上是关于R unnest_tokens 列表中的元素的主要内容,如果未能解决你的问题,请参考以下文章

unnest_tokens 及其错误(“”)

如何删除此列表中的重复元素?

如何汇集列表列表中的所有元素?在 R 中

如何对R中的列表中的元素进行排序?

如何将元素添加到R中的列表(循环)[重复]

从R中的列表中打包和解包元素