SOLR - TikaEntityProcessor - BLOB导入

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SOLR - TikaEntityProcessor - BLOB导入相关的知识,希望对你有一定的参考价值。

我有问题确切地知道如何将SQL Server数据库中的blob数据导入SOLR。这也与NAV挂钩。我已经设法从NAV中的表中获取数据,但是我需要SOLR中的这些数据用于搜索目的。

这是我当前的dataConfig文件。

<dataConfig>
    <dataSource name="dastream" type="FieldStreamDataSource" />
    <dataSource name="db" driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://localhost;databaseName=TestingDB" user="sa" password="*******" />
    <document name="items">
        <entity name="item"  query="select [No_], [Desc_ English] as desceng from [Foo$Item]" dataSource="db">
            <field column="No_" name="id" />

            <entity processor="TikaEntityProcessor" url="desceng" dataField="item.desceng" name="blob" dataSource="dastream" format="text" >
                <field column="text" name="desceng"  />
            </entity>
        </entity>

    </document>

</dataConfig>

我一直得到的错误是:


完全导入失败:java.lang.RuntimeException:java.lang.RuntimeException:org.apache.solr.handler.dataimport.DataImportHandlerException:java.lang.RuntimeException:unsupported type:class java.lang.String


我不确定我错过了什么。

答案

也许这是因为Nav以他自己的方式存储blob。看到这个question。这里有一个如何使用python提取数据的例子。

以上是关于SOLR - TikaEntityProcessor - BLOB导入的主要内容,如果未能解决你的问题,请参考以下文章

Solr——Solr7安装教程

Solr入门-Solr服务安装(windows系统)

Solr使用——啥是solr

Solr简单总结

solr 4.9 中文分词配置

centos7 安装solr