tm readPDF:文件错误(con,“r”):无法打开连接

Posted

技术标签:

【中文标题】tm readPDF:文件错误(con,“r”):无法打开连接【英文标题】:tm readPDF: Error in file(con, "r") : cannot open the connection 【发布时间】:2013-08-07 11:18:56 【问题描述】:

我试过example code recommended in the tm::readPDF documentation:

library(tm)

if(all(file.exists(Sys.which(c("pdfinfo", "pdftotext"))))) 
    uri <- system.file(file.path("doc", "tm.pdf"), package = "tm")
    pdf <- readPDF(PdftotextOptions = "-layout")(elem = list(uri = uri),
                                                 language = "en",
                                                 id = "id1")
    pdf[1:13]

但我得到以下错误(在调用readPDF返回的函数后发生):

Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") :
  cannot open file 'C:\DOCUME~1\Tomas\LOCALS~1\Temp\RtmpU33iWo\pdfinfo31c2bd5762a': No such file or directory

请注意,我已将所有 xpdf 二进制文件安装到当前目录(但这由 if 条件处理)。

编辑:发现这是一个错误。最简单的解决方法是什么?

【问题讨论】:

简单的解决方法:***.com/questions/17979074/… 【参考方案1】:

tm:::pdfinfo() 中进行了一些调试,发现它失败了:

status <- system2("pdfinfo", shQuote(normalizePath(file)), 
        stdout = outfile)

此命令不会创建输出文件。根据Redirect system2 stdout to a file on windows,这是一个错误!

【讨论】:

以上是关于tm readPDF:文件错误(con,“r”):无法打开连接的主要内容,如果未能解决你的问题,请参考以下文章

在 R 中使用 TM 包的 VCorpus 时遇到的错误

csharp readPdf.cs

R 并行中的 Linux 服务器崩溃 - 反序列化错误(node$con):从连接读取错误

R语言文本挖掘

package:tm

如何确定哪个旧版本的 R 包与我的 R 版本兼容