Lucene索引的初步创建

Posted 木子小僧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Lucene索引的初步创建相关的知识,希望对你有一定的参考价值。

  从百度上知道的,Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库,虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆。

 

用的是Lucene 5.5.0版本,下载地址http://archive.apache.org/dist/lucene/java/5.5.0/

一,下载后,需要找到Lucene需要的核心jar包

lucene-analyzers-common-5.5.0.jar

lucene-core-5.5.0.jar

lucene-queryparser-5.5.0.jar

找到核心jar包后,导入到开发项目的lib下。

二、建立索引的步骤

1、创建Directory

2、创建IndexWriter

3、创建Document对象

4、往Document添加Field

5、通过IndexWriter添加文档到索引中

三、实例开发

其中:FSDirectory.open(Paths.get("D://lucene//index"));  是将索引建立在自己电脑上硬盘上。

        如果建立在内存中,就可以使用Directory directory = new RAMDirectory();//建立在内存中

   /**
     * 建立索引
     */
    public void createIndex(){
        //1,创建Directory
        Directory directory = null;
        //2,创建IndexWriter
        Analyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        IndexWriter indexWriter = null;
        try {
            directory = FSDirectory.open(Paths.get("D://lucene//index"));  
            indexWriter = new IndexWriter(directory, config);
            //3,创建Document对象
            Document doc = null;
            //4,位Document添加Field
            File f = new File("D://text");
            for(File file:f.listFiles()){
                doc = new Document();
                @SuppressWarnings("deprecation")
                Field content = new Field("content", new FileReader(file));
                @SuppressWarnings("deprecation")
                Field filename = new Field("filename", file.getName(), Field.Store.YES, Field.Index.NOT_ANALYZED);
                @SuppressWarnings("deprecation")
                Field pathFile = new Field("path", file.getAbsolutePath(), Field.Store.YES, Field.Index.NOT_ANALYZED);
                doc.add(content);
                doc.add(filename);
                doc.add(pathFile);
                //5,通过IndexWriter添加文档到索引中
                indexWriter.addDocument(doc);
            }
            
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }finally{
            if(indexWriter != null)
                try {
                    indexWriter.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
        }
        
    }

执行后,可以看到索引文件:

 

 OK,索引就建好了。

 

以上是关于Lucene索引的初步创建的主要内容,如果未能解决你的问题,请参考以下文章

[lucene系列笔记2]在eclipse里初步使用lucene的索引和查询功能

Solr学习

Lucene的数值索引以及范围查询

Lucene初探之索引过程分析

Lucene初探之索引过程分析

lucene之创建索引代码