.Net利用Lucene分词器怎么索引不到数字

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了.Net利用Lucene分词器怎么索引不到数字相关的知识,希望对你有一定的参考价值。

我只用过盘古分词,也没有数字,不过它有一个关键词库文件,用盘古提供的程序打开后,可以添加新关键词,比如:2014 2013。这样它就能分出数字了。供参考,Lucene分词器估计差不多 参考技术A 因为数字一般都属于停用词的,所以构建索引时被过滤掉。

(VIP-朝夕教育)2021-06-06 .NET高级班 39-搜索引擎Lucene的使用

lucene的基本说明

/// lucene.net:全文检索的工具包,不是应用,只是个类库,完成了全文检索的功能
/// 就是把数据拆分—存起来—查询时—拆分—匹配—结果
///
/// Analysis–分词器,负责把字符串拆分成原子,包含了标准分词,直接空格拆分
/// 项目中用的是盘古中文分词,
/// Document–数据结构,定义存储数据的格式
/// Index–索引的读写类
/// QueryParser–查询解析器,负责解析查询语句
/// Search—负责各种查询类,命令解析后得到就是查询类
/// Store—索引存储类,负责文件夹等等
/// Util—常见工具类库
///
/// lucene是全文搜索必备的,是大型系统必备的
///

以上是关于.Net利用Lucene分词器怎么索引不到数字的主要内容,如果未能解决你的问题,请参考以下文章

lucene中分词和索引的区别

lucene之分词器和Luke工具介绍

Lucene 索引维护

ES中的分词器

各位大神,lucene分词后,怎么按着词频倒序排列

lucene构建同义词分词器