从 ruby 中的 pdf 文件中获取元数据
Posted
技术标签:
【中文标题】从 ruby 中的 pdf 文件中获取元数据【英文标题】:get metadata from a pdf file in ruby 【发布时间】:2018-03-28 15:32:41 【问题描述】:我正在尝试通过“pdf-reader”gem 从 pdf 中读取唯一编号,但由于某种原因,它不只是读取该页面。除了第一页,所有页面都可以正常读取。当它读取时,它返回空。
I am using following code
reader = PDF::Reader.new(filename)
reader.pages.each do |page|
puts page.text
end
【问题讨论】:
你能分享这份文件吗? 【参考方案1】:Fixed by reading from raw data..
感谢您的帮助。
【讨论】:
以上是关于从 ruby 中的 pdf 文件中获取元数据的主要内容,如果未能解决你的问题,请参考以下文章
如何从光束中的 PCollection<string> 获取所有文件元数据