04.全文检索的原理-创建索引

Posted 绿茵好莱坞

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了04.全文检索的原理-创建索引相关的知识,希望对你有一定的参考价值。

你要想查这个东西,得先把库建好。先创建索引再查询索引,这两部分。建立索引,先把文档内容里面的词找出来然后建立索引。我们这里就是一个分析的过程,分析怎么分析?词与词之间有空格,根据空格来把它分词就可以了。在关系型数据库中查询的时候大小写单词是没有关系的。在Java里面,大小写字母是不同字符串,都转换成大写或者都转换成小写都可以啊。但是你要统一一个大小写,统一完了之后你大写开头的单词(例如Lucene)和小写开头的单词(例如lucene)就是同一个单词。去除常用词,is或者a这些,没有什么实际意义,一般不会用它们来建立索引。

以上是关于04.全文检索的原理-创建索引的主要内容,如果未能解决你的问题,请参考以下文章

Lucene学习总结之一:全文检索的基本原理

lucene 全文检索原理和流程

Hack Day全文检索引擎Lucene原理

搜素引擎全文检索原理

Lucene全文搜索原理与使用

查询中使用全文索引