R Script pdf to excel using pdftools

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R Script pdf to excel using pdftools相关的知识,希望对你有一定的参考价值。

我正在使用pdftools将pdf转换为excel。我想提取表值。下面的代码工作得很好,但它将所有内容粘贴到行中(我的意思是值不是以不同的颜色分隔 - 我唯一想要的是表格,因为它在pdf中(数据和值)有人可以帮助代码吗?也许我们需要一个分隔符?我希望得到一些帮助!下面的3张图片: - 我得到的Excel输出,预期的Excel输出和我正在使用的PDF。

library(pdftools)
tx<-pdf_text("Path")
tx2<-strsplit(tx,"
")
library(xlsx)
write.xlsx(tx2,file="ds.xlsx")
答案

试试这个...

library(pdftools)
library(stringr)
library(xlsx)

tx <- pdf_text("Path")
tx2 <- unlist(str_split(tx, "[\r\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\s{2,}", 5)

write.xlsx(tx3, file="ds.xlsx")

以上是关于R Script pdf to excel using pdftools的主要内容,如果未能解决你的问题,请参考以下文章

Kendo UI:在导出到 excel 和 pdf 期间操作网格列

在 R 中导入 excel 表头

通过winrs执行远程主机的脚本,将excel转换成pdf

jQuery插件,用于将html表导出为JSON、XML、CSV、TSV、TXT、SQL、Word、Excel、PNG和PDF

pandas提示"Cannot convert {0!r} to Excel".format(value)

python Pandas排序/订购(来自http://stackoverflow.com/questions/17618981/how-to-sort-pandas-data-frame-using