无法将带有字符串的文本文件转换为 R 中每行一个字符的列

Posted

技术标签:

【中文标题】无法将带有字符串的文本文件转换为 R 中每行一个字符的列【英文标题】:Trouble turning a text file with a character string into a column with one character per row in R 【发布时间】:2022-01-09 07:28:30 【问题描述】:

我对 R 比较陌生,正在尝试将具有长字符串的文本文件转换为数据表的单列,每行一个字符。我尝试使用 readr 包中的 read_file 读取文本文件,然后将字符串设为列表,最后使用 cbind,如下所示:

df <- data.frame("id" = 1:9)
string <-read_file("StringFilePath.txt")
string <- as.list(string)
df <- cbind(df, string)

不幸的是,我最终得到了数据框第一行中字符串中的所有字符。我还尝试过,也许是被误导了,在每个字符之间添加一个逗号,然后创建一个 .csv 文件,我可以更轻松地使用如下:

string <- gsub("(?<=.)(?=.)", ",", string, perl = TRUE)
write.csv(string, "StringFilePath.csv",
          row.names = FALSE)

但是,由于我无法理解的原因,.csv 最终在第一行中包含大约一半的字符。对于这个看似简单的问题的解决方案的任何建议将不胜感激!

【问题讨论】:

【参考方案1】:

您可以使用strsplit。请注意 strsplit 返回一个列表,因此您必须将其转换为字符向量

string <- "jasdklnjabfial"
data.table::data.table(x = unlist(strsplit(string, "")))
#>     x
#>  1: j
#>  2: a
#>  3: s
#>  4: d
#>  5: k
#>  6: l
#>  7: n
#>  8: j
#>  9: a
#> 10: b
#> 11: f
#> 12: i
#> 13: a
#> 14: l

【讨论】:

以上是关于无法将带有字符串的文本文件转换为 R 中每行一个字符的列的主要内容,如果未能解决你的问题,请参考以下文章

vim打开文件中每行末尾都带有 ^M

利用cat命令显示文本内容时,要在Linux每行的行尾显示$符号,该命令应带有啥?

python中向文本每行行尾添加字符

无法将数据流从 AJAX 响应转换为 CSV 文件

将字符串转换为应用程序/八位字节流 Java

将多个分类变量转换为R中的因子