使用ElasticSearch / Symfony从pdf文件获取数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用ElasticSearch / Symfony从pdf文件获取数据相关的知识,希望对你有一定的参考价值。

实际上我正在使用Symfony并且我已经集成了ElasticSearch,我想从Pdf文件(名称,年龄,地址)/或文本文件中提取数据,以便获得一个填充数据的表单如何做到这一点? Ps:我已经配置了elastic.yml我已经添加了所有的索引,当我访问了127.0.0.1:9200时,我的对象成功(json格式)我想要的是如何从pdf文件中读取并检索所有数据

答案

你必须使用像https://pdfparser.org/documentation这样的pdf解析库

$parser = new SmalotPdfParserParser();
$pdf    = $parser->parseFile('document.pdf');

$text = $pdf->getText();
echo $text;

以上是关于使用ElasticSearch / Symfony从pdf文件获取数据的主要内容,如果未能解决你的问题,请参考以下文章

在 Symfony 中使用预先存在的库

Symfony控制器教程已开课

Symfony 2 还是 Symfony 1.4? [关闭]

无法使用 Symfony 5 安装 FOSRestBundle

如何使用 symfony 4 创建登录验证表单

Symfony 2 - 使用资产