空解析器 tika python

Posted

技术标签:

【中文标题】空解析器 tika python【英文标题】:Empty parsers tika python 【发布时间】:2021-02-18 14:11:10 【问题描述】:

当我对 tika 运行一个简单的命令时,我得到空的解析器。

    from tika import parser
    url = 'mygroovyurl'
    string_parsed = parser.from_buffer('Good evening, Dave', serverEndpoint=url)
    string_parsed

我回来了

'metadata': 'Content-Type': 'application/x-www-form-urlencoded',
  'X-Parsed-By': 'org.apache.tika.parser.EmptyParser',
  'X-TIKA:embedded_depth': '0',
  'X-TIKA:parse_time_millis': '1',
 'content': None,
 'status': 200

【问题讨论】:

你有什么解析器?你查过tika.config.getParsers() 【参考方案1】:

这是对传出数据进行编码的网络安全设置 (application/x-www-form-urlencoded)。解析器在那里(我检查过),但是这个服务器可以很好地用于网络外的调用。

【讨论】:

以上是关于空解析器 tika python的主要内容,如果未能解决你的问题,请参考以下文章

Tika Parser放慢了StormCrawler的速度

Python Tika 无法从 url 解析 pdf

SAX XML 解析器抛出空指针异常

如何使用 statx 解析器识别空 xml 标记

Android - Jackson JSON 解析器在“发布”版本中返回空值

Apache Tika 和文件访问而不是 Java 输入流