Lucene搜索详解

Posted 2020-11-05 morn21

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Lucene搜索详解相关的知识，希望对你有一定的参考价值。

学习目标：

掌握lucene搜索的编写步骤
掌握lucene搜索核心API
掌握lucene提供的基本查询
掌握查询解析器的用法及语法

搜索流程详解

1、架构图

技术分享图片

2、Lucene搜索API 图示

3、Lucene搜索代码示例

public class SearchBaseFlow {
    public static void main(String[] args) throws IOException, ParseException {
        //使用的分词器
        Analyzer analyzer = new IKAnalyzer4Lucene7(true);
        //索引存储目录
        Directory directory = FSDirectory.open(Paths.get("f:/test/indextest"));
        //索引读取器
        IndexReader indexReader = DirectoryReader.open(directory);
        //索引搜索器
        IndexSearcher indexSearcher = new IndexSearcher(indexReader);
        //要搜索的字段
        String filedName = "name";
        //查询生成器（解析输入生成Query查询对象）
        QueryParser parser = new QueryParser(filedName, analyzer);
        //通过parse解析输入（分词），生成query对象
        Query query = parser.parse("Thinkpad");
        //搜索，得到TopN的结果（结果中有命中总数，topN的scoreDocs（评分文档（文档id，评分）））
        TopDocs topDocs = indexSearcher.search(query, 10);   //前10条

        //获得总命中数
        System.out.println(topDocs.totalHits);

        //遍历topN结果的scoreDocs,取出文档id对应的文档信息
        for (ScoreDoc sdoc : topDocs.scoreDocs) {
            //根据文档id取存储的文档
            Document hitDoc = indexSearcher.doc(sdoc.doc);
            //取文档的字段
            System.out.println(hitDoc.get(filedName));
        }

        //使用完毕，关闭、释放资源
        indexReader.close();
        directory.close();
    }
}

搜索核心API详解

1、核心API图示：

技术分享图片

2、IndexReader 索引读取器

Open一个读取器，读取的是该时刻点的索引视图。如果后续索引发生改变，需重新open一个读取器。获得索引读取器的方式：

DirectoryReader.open(IndexWriter indexWriter) 优先使用
DirectoryReader.open(Directory)
DirectoryReader.openIfChanged(DirectoryReader) 共享当前reader资源重新打开一个（当索引变化时）

IndexReader分为两类：

叶子读取器：支持获取stored fields, doc values, terms（词项）, and postings （词项对应的文档）
复合读取器：多个读取器的复合。只可直接用它获取stored fields 。在内部通过CompositeReader.getSequentialSubReaders 得到里面的叶子读取器来获取其他数据。
DirectoryReader 是复合读取器

注意：IndexReader是线程安全的。

IndexReader 主要API：

LeafReader 主要API：

3、IndexSearcher 索引搜索器

应用通过调用它的search(Query,int)重载方法在一个IndexReader上实现搜索。出于性能的考虑，请使用一个IndexSearcher实例，除非索引发生变化。如索引更新了则通过DirectoryReader.openIfChanged(DirectoryReader) 取得新的读取器，再创建新的搜索器。

注意：IndexSearcher是线程安全的。

4、IndexSearcher 索引搜索器API

搜索 API：