如何从字符串中提取主题标签并导出为 csv?
Posted
技术标签:
【中文标题】如何从字符串中提取主题标签并导出为 csv?【英文标题】:How can I extract hashtags from strings and export as a csv? 【发布时间】:2021-12-25 16:05:51 【问题描述】:我使用以下函数从文本数据中提取主题标签:
a <- c("#aaa", "#bbb", "#ccc")
hashtag_pat <- "#[a-zA-Z0-9_-ー\\.]+"
hashtag <- str_extract_all(a, hashtag_pat)
这是输出:
[[1]]
[1] "#aaa"
[[2]]
[1] "#bbb"
[[3]]
[1] "#ccc"
但是,我无法将其正确导出为 csv。我需要将所有这些单词放在一个单元格中(用空格分隔)。导出这个的最好方法是什么? 以下是“write.csv”给我的内容。如果您能帮助解决这个问题,我将不胜感激。
【问题讨论】:
在写入输出之前使用paste(hashtag, collapse = " ")
?
您在 csv 文件中的预期输出(带有或不带有标签)是什么?
我也需要#号。
【参考方案1】:
澄清后更新:
df <- data.frame(col1 = paste(a,collapse=" "))
df
col1
1 #aaa #bbb #ccc
您是否正在寻找这样的解决方案?
hashtag <- sub("^\\#", "", a)
write.csv(data.frame(t(unlist(hashtag))), "my_file.csv")
【讨论】:
我实际上想要一个单元格中的所有主题标签,用空格分隔。 请看我的更新。希望我的理解正确! 非常感谢。这解决了问题。非常感谢!以上是关于如何从字符串中提取主题标签并导出为 csv?的主要内容,如果未能解决你的问题,请参考以下文章