从 df 列 R 中提取特定文本部分

Posted 2023-02-14

技术标签:

【中文标题】从 df 列 R 中提取特定文本部分【英文标题】：Extract specific text parts from df column R 【发布时间】：2022-01-13 06:52:34 【问题描述】：

我有一个问题，如何提取部分文本并将它们转换为 df 输出。

这是我的 df 示例，输出我的一列中的一行（一个单元格的内容）

["id"=>"aaaaaaaaaaaaaaaa", "effortDate"=>"2021-07-04T23:00:00.000Z", "effort"=>2, "author"=>"a:aa:a", "id"=>"bbbbbbbbbbbbbb", "effortDate"=>"2021-07-11T23:00:00.000Z", "effort"=>1, "author"=>"b:bb:b", "id"=>"ccccccccccccc", "effortDate"=>"2021-07-17T23:00:00.000Z", "effort"=>1, "author"=>"c:cc:c"]

我的预期输出将是 2 列，其中包含我从该字符串中获得的行数：

努力日期 2021-07-04 2021-04-11

第二栏努力 2 1

有什么建议可以实现吗？

谢谢！

【问题讨论】：

【参考方案1】：

看起来像 json-content... 但 => 与阅读混淆。换成:就可以正常阅读了。

mystr <- '["id"=>"aaaaaaaaaaaaaaaa", "effortDate"=>"2021-07-04T23:00:00.000Z", "effort"=>2, "author"=>"a:aa:a", "id"=>"bbbbbbbbbbbbbb", "effortDate"=>"2021-07-11T23:00:00.000Z", "effort"=>1, "author"=>"b:bb:b", "id"=>"ccccccccccccc", "effortDate"=>"2021-07-17T23:00:00.000Z", "effort"=>1, "author"=>"c:cc:c"]'

jsonlite::fromJSON(gsub("=>", ":", mystr))
#                 id               effortDate effort author
# 1 aaaaaaaaaaaaaaaa 2021-07-04T23:00:00.000Z      2 a:aa:a
# 2   bbbbbbbbbbbbbb 2021-07-11T23:00:00.000Z      1 b:bb:b
# 3    ccccccccccccc 2021-07-17T23:00:00.000Z      1 c:cc:c

【讨论】：

这速度超快，非常感谢！

以上是关于从 df 列 R 中提取特定文本部分的主要内容，如果未能解决你的问题，请参考以下文章