如何从字符串中提取主题标签并导出为 csv?

Posted

技术标签:

【中文标题】如何从字符串中提取主题标签并导出为 csv?【英文标题】:How can I extract hashtags from strings and export as a csv? 【发布时间】:2021-12-25 16:05:51 【问题描述】:

我使用以下函数从文本数据中提取主题标签:

a <- c("#aaa", "#bbb", "#ccc")
hashtag_pat <- "#[a-zA-Z0-9_-ー\\.]+"
hashtag <- str_extract_all(a, hashtag_pat)

这是输出:

[[1]]
[1] "#aaa"

[[2]]
[1] "#bbb"

[[3]]
[1] "#ccc"

但是,我无法将其正确导出为 csv。我需要将所有这些单词放在一个单元格中(用空格分隔)。导出这个的最好方法是什么? 以下是“write.csv”给我的内容。如果您能帮助解决这个问题,我将不胜感激。

【问题讨论】:

在写入输出之前使用paste(hashtag, collapse = " ") 您在 csv 文件中的预期输出(带有或不带有标签)是什么? 我也需要#号。 【参考方案1】:

澄清后更新:

df <- data.frame(col1 = paste(a,collapse=" "))
df
            col1
1 #aaa #bbb #ccc

您是否正在寻找这样的解决方案?

hashtag <- sub("^\\#", "", a)
write.csv(data.frame(t(unlist(hashtag))), "my_file.csv")

【讨论】:

我实际上想要一个单元格中的所有主题标签,用空格分隔。 请看我的更新。希望我的理解正确! 非常感谢。这解决了问题。非常感谢!

以上是关于如何从字符串中提取主题标签并导出为 csv?的主要内容,如果未能解决你的问题,请参考以下文章

如何从字符向量中解析 CSV 数据以提取数据框?

前端js实现数据写csv文件,并下载

从主题中提取特定字符串格式以进行排序

js 采用a 标签导出csv

在 MySql 中,如何将 csv 文件中的 sql 字符串中的空值导出为双引号(“”)?

使用 JMeter,如何从 API 的响应正文中提取字符串并将其保存到 csv 文件?