当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本
Posted
技术标签:
【中文标题】当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本【英文标题】:When I use the package AcademicTwitterR and function 'get_all_tweets' it seems to return the shortened version of the original tweet 【发布时间】:2022-01-18 12:10:54 【问题描述】:我正在尝试提取使用特定术语进行主题分析的推文。
我能够使用带有函数get_all_tweets
的 R 包 AcademicTwitterR 成功提取推文。但是,文本/推文似乎比原文有所缩短。
例如,推文文本可能如下所示:
“不完全是,虽然入侵物种也可能成为问题 (与澳大利亚人谈论兔子……”
我想拉整条推文。
我使用的示例代码:
df <- get_all_tweets(query = "invasive species", start_tweets = "2006-10-01T00:00:00Z",end_tweets = "2021-10-01T00:00:00Z")
【问题讨论】:
这是所有推文的情况,还是仅转推? 啊,是的,看起来它可能只是转发(以 RT 开头的文本)。谢谢! 【参考方案1】:制作包裹的克里斯托弗·巴里回答道。代码确实提取了所有推文,但我绑定推文行的方式是问题。
绑定将 JSON 文件转换为各种数据帧格式的行的替代选项:
“香草”格式。从 jsonlite::read_json 直接输出。它可以很好地显示文本等列。
bind_tweets(data_path = "tweetdata") %>% as_tibble
“原始”格式。包含在 API 调用中提取的所有数据的数据帧列表。
bind_tweets(data_path = "tweetdata", output_format = "raw") %>% names
“整洁”的格式。
bind_tweets(data_path = "tweetdata", output_format = "tidy")
更多信息在这里:
https://cran.r-project.org/web/packages/academictwitteR/vignettes/academictwitteR-tidy.html
【讨论】:
不要在链接中留下您的答案。保留链接以供参考,但在您的帖子中解释对您有用的内容。这种方法避免了将来出现死链接的问题。 ;-) 您的答案可以通过额外的支持信息得到改进。请edit 添加更多详细信息,例如引用或文档,以便其他人可以确认您的答案是正确的。你可以找到更多关于如何写好答案的信息in the help center。以上是关于当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本的主要内容,如果未能解决你的问题,请参考以下文章