MySql5.7InnoDB全文索引(针对中文搜索)

Posted lykbk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySql5.7InnoDB全文索引(针对中文搜索)相关的知识,希望对你有一定的参考价值。

 

1、ngram and MeCab full-text parser plugins

全文检索在mysql里面很早就支持了,只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符,而对于中文来讲,显然用空格就不合适,需要针对中文语义进行分词。但从MySQL 5.7开始,MySQL内置了ngram全文检索插件,用来支持中文分词,并且对MyISAM和InnoDB引擎有效。

2、必要的参数设置

在使用中文检索分词插件ngram之前,先得在MySQL配置文件里面设置他的分词大小(默认是2),比如,

[mysqld]
ngram_token_size=2

分词的SIZE越小,索引的体积就越大,所以要根据自身情况来设置合适的大小。

3、添加全文索引

alter table testtable add fulltext index testfulltext(clumn1,clumn2) with parser ngram;
当然也可以在建表时

CREATE TABLE articles (
id INTUNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body) WITH PARSER ngram
) ENGINE=InnoDB CHARACTER SET utf8mb4;

4、查询索引

按自然语言搜索模式查询
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (‘关键词‘ IN NATURAL LANGUAGE MODE); 按布尔全文搜索模式查询
2.1 匹配既有管理又有数据库的记录
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (‘+数据库 +管理‘ IN BOOLEAN MODE);
2.2匹配有数据库,但是没有管理的记录
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (‘+数据库 -管理‘ IN BOOLEAN MODE);
2.3匹配MySQL,但是把数据库的相关性降低
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (‘>数据库 +MySQL‘ INBOOLEAN MODE);

以上是关于MySql5.7InnoDB全文索引(针对中文搜索)的主要内容,如果未能解决你的问题,请参考以下文章

mysql 普通索引和全文索引的区别

django全文检索

MySql学习之全文检索

全文搜索的索引列

全文索引和搜索速度

立即更新全文搜索索引 - SQL SERVER 2012