Lucene 基础类型

Posted kenny.wmh

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Lucene 基础类型相关的知识,希望对你有一定的参考价值。

Lucene 索引文件中,用一下基本类型来保存信息:
1. Byte:是最基本的类型,长 8 位(bit)。
2. UInt32:由 4 个 Byte 组成。
3. UInt64:由 8 个 Byte 组成。
4. VInt:
" 变长的整数类型,它可能包 多个 Byte,对于每个 Byte 的 8 位,其中后 7 位表示数值,最高 1 位表示是否还有另一个 Byte,0 表示没有,1 表示有。
" 越前面的 Byte 表示数值的低位,越后面的 Byte 表示数值的高位。
" 例如 130 化为二进制为 1000, 0010,总共需要 8 位,一个 Byte 表示不了,因而需要两个 Byte 来表示,第一个 Byte 表示后 7 位,并且在最高位置 1 来表示后面还有 一个Byte,所以为(1) 0000010,第二个Byte表示第8位,并且最高位置0来表示 后面没有其他的 Byte 了,所以为(0) 0000001。

 5.Chars:是 UTF-8 编码的一系列 Byte。

 6.String:一个字符串首先是一个 VInt 来表示此字符串包 的字符的个数,接着便是 UTF-8编码的字符序列 Chars。

以上是关于Lucene 基础类型的主要内容,如果未能解决你的问题,请参考以下文章

Lucene 基础数据压缩处理

Elasticsearch技术解析与实战基础概念及环境搭建

es基础用法

由于Elasticsearch是在 Lucene 基础上构建

后端技术杂谈3:Lucene基础原理与实践

Lucene的学习与总结