当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本

Posted

技术标签:

【中文标题】当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本【英文标题】:When I use the package AcademicTwitterR and function 'get_all_tweets' it seems to return the shortened version of the original tweet 【发布时间】:2022-01-18 12:10:54 【问题描述】:

我正在尝试提取使用特定术语进行主题分析的推文。

我能够使用带有函数get_all_tweets 的 R 包 AcademicTwitterR 成功提取推文。但是,文本/推文似乎比原文有所缩短。

例如,推文文本可能如下所示:

“不完全是,虽然入侵物种也可能成为问题 (与澳大利亚人谈论兔子……”

我想拉整条推文。

我使用的示例代码:

df <- get_all_tweets(query = "invasive species", start_tweets = "2006-10-01T00:00:00Z",end_tweets = "2021-10-01T00:00:00Z")

【问题讨论】:

这是所有推文的情况,还是仅转推? 啊,是的,看起来它可能只是转发(以 RT 开头的文本)。谢谢! 【参考方案1】:

制作包裹的克里斯托弗·巴里回答道。代码确实提取了所有推文,但我绑定推文行的方式是问题。

绑定将 JSON 文件转换为各种数据帧格式的行的替代选项:

“香草”格式。从 jsonlite::read_json 直接输出。它可以很好地显示文本等列。

bind_tweets(data_path = "tweetdata") %>% as_tibble

“原始”格式。包含在 API 调用中提取的所有数据的数据帧列表。

bind_tweets(data_path = "tweetdata", output_format = "raw") %>% names

“整洁”的格式。

bind_tweets(data_path = "tweetdata", output_format = "tidy")

更多信息在这里:

https://cran.r-project.org/web/packages/academictwitteR/vignettes/academictwitteR-tidy.html

【讨论】:

不要在链接中留下您的答案。保留链接以供参考,但在您的帖子中解释对您有用的内容。这种方法避免了将来出现死链接的问题。 ;-) 您的答案可以通过额外的支持信息得到改进。请edit 添加更多详细信息,例如引用或文档,以便其他人可以确认您的答案是正确的。你可以找到更多关于如何写好答案的信息in the help center。

以上是关于当我使用包 AcademicTwitterR 和函数“get_all_tweets”时,它似乎返回了原始推文的缩短版本的主要内容,如果未能解决你的问题,请参考以下文章

Node.js——模块与包管理工具

第二周作业

Haskell 中的单子——洪峰老师讲创客道(三十五)

数据库问题6-將系統資料表對應至系統檢視

TypeScript的箭头函数

Android SQLiteDatabase分析