Lucene和Solr学习总结

Posted 2021-01-22 a-small-lyf

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Lucene和Solr学习总结相关的知识，希望对你有一定的参考价值。

我们使用的百度搜索和电商网站的搜索功能一般都是基于Lucene实现的，Solr就是对Lucene进行的封装，就像Servlet和Struts2，SpringMvc一样

说的专业点就是全文检索

实现全文检索的流程的大致操作如下

这张图表现的很清晰，网上扒下来的

索引库中应该包含两部分，一部分是索引，一部分是文档，索引包含对应文档的id，通过该id可以查找到文档

技术分享图片

来看看我的第一个Lucene入门程序

先整理步骤

/*
*
* 创建索引
* 查询索引
* 1，创建indexwriter对象，
* 指定索引库存放位置Directory对象
* 指定一个分析器，对文档内容进行分析
* 2，创建document对象
* 3，创建field对象，将field添加到document对象中
* 4，使用indexwriter对象把document对象写入索引库，
* 此过程进行索引创建，并将document对象和索引都写入索引库
* 5，关闭indexwriter对象
*/

public class FirstLucene {

//创建索引和查询索引要使用同一份分析器(分词器)

@Test

public void createIndex() throws Exception {

//指定索引库存放位置Directory对象

Directory directory = FSDirectory.open(new File("D://lucene//index"));

Analyzer analyzer = new IKAnalyzer();//中文分词器

IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);//指定分析器

IndexWriter indexWriter = new IndexWriter(directory, config);//创建IndexWriter

File f = new File("D://lucene//searchsource");//源文件的的路径，对这些文件进行分析，添加索引

File[] listFiles = f.listFiles();

for (File file : listFiles) {

Document document = new Document();

//文件名

String name = file.getName();

//TextField存储字符串或流分析Yes 索引Yes 保存Yes

Field fileNameField = new TextField("fielName", name, Store.YES);

//文件大小

long file_size = FileUtils.sizeOf(file);

//LongField存储long型分析Yes 索引Yes 保存Yes or No

Field fileSizeField = new LongField("fileSize",file_size,Store.YES);

//StringField存储字符串分析 N 索引Y 保存Yes or No

//文件路径

String file_path = file.getPath();

//StoreFieldc可以存储多种类型分析No 索引No 保存Yes

Field filePathField = new StoredField("filePath", file_path);

//文件内容

String file_content = FileUtils.readFileToString(file);

Field fileContentField = new TextField("file_content", file_content, Store.YES);

//把域添加到文档中

document.add(fileNameField);

document.add(fileSizeField);

document.add(filePathField);

document.add(fileContentField);

//使用indexwriter对象添加文档 ,此过程进行索引创建，并将document对象和索引都写入索引库

indexWriter.addDocument(document);

}

indexWriter.close();

}

看到这里相信你也已经或创建索引了，加油

public class FirstLucene {

//创建索引和查询索引要使用同一份分析器(分词器)

@Test

public void createIndex() throws Exception {

Directory directory = FSDirectory.open(new File("D://lucene//index"));//指定索引库存放位置Directory对象

Analyzer analyzer = new IKAnalyzer();//官方推荐使用这个实现类

IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);//指定分析器

IndexWriter indexWriter = new IndexWriter(directory, config);//创建IndexWriter

File f = new File("D://lucene//searchsource");//源文件的的路径

File[] listFiles = f.listFiles();

for (File file : listFiles) {

Document document = new Document();

//文件名

String name = file.getName();

//TextField存储字符串或流分析Yes 索引Yes 保存Yes

Field fileNameField = new TextField("fielName", name, Store.YES);

//文件大小

long file_size = FileUtils.sizeOf(file);

//LongField存储long型分析Yes 索引Yes 保存Yes or No

Field fileSizeField = new LongField("fileSize",file_size,Store.YES);

//StringField存储字符串分析 N 索引Y 保存Yes or No

//文件路径

String file_path = file.getPath();

//StoreFieldc可以存储多种类型分析No 索引No 保存Yes

Field filePathField = new StoredField("filePath", file_path);

//文件内容

String file_content = FileUtils.readFileToString(file);

Field fileContentField = new TextField("file_content", file_content, Store.YES);

//把域添加到文档中

document.add(fileNameField);

document.add(fileSizeField);

document.add(filePathField);

document.add(fileContentField);

//使用indexwriter对象添加文档 ,此过程进行索引创建，并将document对象和索引都写入索引库

indexWriter.addDocument(document);

}

indexWriter.close();

}

以上是关于Lucene和Solr学习总结的主要内容，如果未能解决你的问题，请参考以下文章