Sql优化-多like模糊查询及根据时间排序

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Sql优化-多like模糊查询及根据时间排序相关的知识,希望对你有一定的参考价值。

参考技术A 2020-04-21

记录一次sql优化记录:

环境:用的mysql版本  select Version();

优化过程:

用的是两张表联查,四个条件like查询 ,根据时间排序降序

其中A,B表没有大字段,A表20万多数据,B表50万多条数据。语句如下:

EXPLAIN

SELECT A.bondId,A.sname,A.cname,A.secuCode,A. ISSUER,A.guarantor,B.underwriter AS infoSource

  FROM   A

  LEFT JOIN  B ON B.bondId = A.bondId

 WHERE B.agentType = 1

 AND B.underwriter = '有限公司'

 AND A.startDate <= '2020-04-21 18:02:10'

 AND A.endDate >= '2020-04-21 18:02:10'

 AND (

 A.cname LIKE '%%'  OR A.sname LIKE '%%'  OR A.secuCode LIKE '%%'

 OR A. ISSUER LIKE '%%'OR A.guarantor LIKE '%%')

 AND A.isValid = 1

 ORDER BY A.startDate DESC

 LIMIT 0, 20

这是2个表都没有加索引的情况,从explain来看结果非常糟糕,都是全表扫描,并且产生临时表同时有文件排序,效率肯定非常低。

首先尝试在B表上建立一个联合索引

可以考虑从关联字段及where条件字段考虑(bondId, underwriter, agentType)

建一个联合索引,试试。

ALTER TABLE B ADD INDEX bua_index(bondId, underwriter, agentType)

再explain看:

可以看到B表用到了我们刚刚建的联合索引,并且额外信息是Using index ,type是ref级别的,效果比较理想,再来看A表。

Where条件中有多个like,这种情况下一般索引都是不可用的,所以必须用覆盖索引解决,

由于又根据startDate排序,所以尝试根据如下字段建立联合索引,同时查询的字段就是索引中的字段(startDate, endDate,cname, sname, secuCode, issuer, guarantor)

ALTER TABLE A ADD INDEX index_scssig(startDate, endDate,cname, sname, secuCode, issuer, guarantor)

再次explain看看效果:

这样乍看上去A表也用到了刚刚建的联合索引,并且type是range级别虽然比ref差点,按理说应该也还可以,但是我执行sql语句,效率还是非常差,查询耗时达到8s,并且偶尔还不止这个时间

究其原因,虽然使用了索引,但是extra里面是Using index condition&Using where

回表操作了,我在想如果将extra优化成Using index效率肯定没问题

故再进一步优化,还是从索引入手

在联合索引上添加2个字段isValid, bondId 再试试

ALTER TABLE A ADD INDEX index_scssig(isvalid,startDate, endDate,cname, sname, secuCode, issuer, guarantor,bondId)

再次explain:

这个结果就是我想要的,然后执行sql看看效率:

已经提升了很多了,但是我试了别的查询条件偶尔时间会到3,4s,怀疑和自己的机器有关

在这这种多个like的or查询mysql本身并不擅长,无奈坑爹的需要需要这样,可能效率并不是非常的高,优化成这样可以接受了。

最近对以前项目的慢查询进行sql调优,感觉性能的下降往往还是sql语句及索引的建立的问题,explain是很有帮助,正确优化还是能极大提升效率的。

Sql Like 通配符 模糊查询技巧及特殊字符

 

1. SQL like对时间查询的处理方法

    SQL数据表中有savetime(smalldatetime类型)字段,表中有两条记录,savetime值为:2005-3-8 12:12:00和2005-6-6 14:02:02 

     我用下面语句什么也搜不出来 
     select * from soft where soft.savetime like‘%2005-3-8%‘ 

     SQL帮助中说: 
     "当搜索 datetime 值时,推荐使用 LIKE,因为 datetime 项可能包含各种日期部分。例如,如果将值 19981231 9:20 插入到名为 arrival_time 的列中,则子句 WHERE arrival_time = 9:20 将无法找到 9:20 字符串的精确匹配,因为 SQL Server 将其转换为 1900 年 1 月 1 日上午 9:20。然而,子句 WHERE arrival_time LIKE ‘%9:20%‘ 将找到匹配。" 

     后运行下面语句SELECT soft.*, CAST(soft.savetime AS varchar(20)) AS strdatetime, 发现SQL把smalldatetime格试转成:03 8 2005 12:12PM 

     我何用 like‘%2005-3-8%‘搜索到2005年3月8日所有的记录?

     select * from soft where datediff(d,soft.savetime,convert(datetime,‘20050308‘,121))=0 
     ---- 
    select * from soft where convert(char(10),soft.savetime,121)=‘20050308‘

2. SQLlike 操作中的特殊字符处理方法:

SQL Server查询过程中,单引号 ‘ 是特殊字符,所以在查询的时候要转换成双单引号 ‘‘ 。

在like操作还有以下特殊字符:下划线_,百分号%,方括号[],尖号^。

其用途如下:

下划线:用于代替一个任意字符(相当于正则表达式中的 ? )

百分号:用于代替任意数目的任意字符(相当于正则表达式中的 * )

方括号:用于转义(事实上只有左方括号用于转义,右方括号使用最近优先原则匹配最近的左方括号)

尖号:用于排除一些字符进行匹配(这个与正则表达式中的一样)

以下是一些匹配的举例,需要说明的是,只有like操作才有这些特殊字符,=操作是没有的。

a_b...        a[_]b%

a%b...       a[%]b%

a[b...       a[[]b%

a]b...       a]b%

a[]b...      a[[]]b%

a[^]b...     a[[][^]]b%

a[^^]b...    a[[][^][^]]b%

在实际进行处理的时候,对于=操作,我们一般只需要如此替换:

‘ -> ‘‘

对于like操作,需要进行以下替换(注意顺序也很重要)

[ -> [[]     (这个必须是第一个替换的!!)

% -> [%]    (这里%是指希望匹配的字符本身包括的%而不是专门用于匹配的通配符)

_ -> [_]

^ -> [^]

3SQL Like 通配符特殊用法:Escape


    阐述Escape 的作用:

    1.使用   ESCAPE   关键字定义转义符。在模式中,当转义符置于通配符之前时,该通配符就解释为普通字符。例如,要搜索在任意位置包含字符串   5%   的字符串,请使用:    
    WHERE   ColumnA   LIKE   ‘%5/%%‘   ESCAPE   ‘/‘ 
    但是在mysql中好像不能使用"/"。
    2.ESCAPE   ‘escape_character‘ 允许在字符串中搜索通配符而不是将其作为通配符使用。escape_character   是放在通配符前表示此特殊用途的字符。 
   
    SELECT   * FROM   finances WHERE   description   LIKE   ‘gs_‘   ESCAPE   ‘S‘ 

   
    意思就是: 
    比如,我们要搜索一个字符串     "g_"     ,如果直接     like     "g_",那么   "_"的作用就是通配符,而不是字符,结果,我们会查到比如 "ga","gb","gc",而不是我们需要的   "g_". 用     LIKE   ‘gs_‘   ESCAPE   ‘S‘     ‘s‘表示特殊用法标志

 

    3.create   table   a   (name   varchar(10)) 
    go 
    insert   into   a   select   ‘11%22‘ 
    union   all   select   ‘11%33‘ 
    union   all   select   ‘12%33‘ 
    go 
    select   *   from   a     WHERE   name   LIKE   ‘%/%33‘   ESCAPE   ‘/‘   --指定用‘/‘符号来说明跟在其后面的通配符字符为普能字符。(第二个%是字符不是通配符来的) 
    go 
    drop   table   a

    结果为: 
    name                
    ----------    
    11%33 
    12%33

 

    总结:

    %:匹配零个及多个任意字符; _:与任意单字符匹配; []:匹配一个范围; [^]:排除一个范围

    Symbol Meaning 
    like ‘5[%]‘ 5% 
     like ‘[_]n‘ _n 
     like ‘[a-cdf]‘ a, b, c, d, or f 
     like ‘[-acdf]‘ -, a, c, d, or f 
     like ‘[[]‘ [ 
     like ‘]‘ ] 
     like ‘abc[_]d%‘ abc_d and abc_de 
     like ‘abc[def]‘ abcd, abce, and abcf 
     like ‘[^1-9]‘ 0 
    like ‘[^1-9b-z]‘ 0, a

    对于字符串中出现的特殊字符:‘%‘,‘[‘,‘[]‘, ‘_‘ 可以使用 ‘[]‘ 把它们包含起来,这样在匹配模式(pattern)中,它们就被当作普通字符对待了。

    1. 用 like ‘[[]‘ 匹配特殊字符 ‘[‘
    select 1 where ‘[ABCDE‘ like ‘[[]%‘


    2. 用 like ‘]‘ 匹配特殊字符 ‘]‘

    select 1 where ‘]ABCDE‘ like ‘]%‘


    3. 用 like ‘[[]]‘ 匹配特殊字符 ‘[]‘

    select 1 where ‘[]ABCDE‘ like ‘[[]]%%‘


    4. 用 like ‘[_]‘ 匹配特殊字符 ‘_‘

    select 1 where ‘_ABCDE‘ like ‘[_]%‘


    5. 用 like ‘[%]‘ 匹配特殊字符 ‘%‘

    select 1 where ‘ABC%DE‘ like ‘ABC[%]DE‘


    对于其他的特殊字符:‘^‘, ‘-‘, ‘]‘ 因为它们本身在包含在 ‘[]‘ 中使用,所以需要用另外的方式来转义,于是就引入了 like 中的 escape 子句,另外值得注意的是:escape 可以转义所有的特殊字符。


    select 1 where ‘^ABCDE‘ like ‘!^ABCDE‘ escape ‘!‘
    select 1 where ‘-ABCDE‘ like ‘!-ABCDE‘ escape ‘!‘
    select 1 where ‘]ABCDE‘ like ‘!]ABCDE‘ escape ‘!‘

    select 1 where ‘%ABCDE‘ like ‘/%ABCDE‘ escape ‘/‘
    select 1 where ‘%ABCDE‘ like ‘!%ABCDE‘ escape ‘!‘
    select 1 where ‘%ABCDE‘ like ‘#%ABCDE‘ escape ‘#‘
    select 1 where ‘%ABCDE‘ like ‘@%ABCDE‘ escape ‘@‘

    select 1 where ‘[ABCDE‘ like ‘![ABCDE‘ escape ‘!‘
    select 1 where ‘]ABCDE‘ like ‘!]ABCDE‘ escape ‘!‘
    规律就是用 escape 后面紧跟着的字符来做转义字符。 escape 后面的字符相当于 C 语言字符串中的转义字符 ‘/‘。

    最后,看一个更加复杂的匹配


    select 1 where ‘[^A-Z]ABCDE‘ like ‘/[/^A/-Z/]%‘ escape ‘/‘

 




























































以上是关于Sql优化-多like模糊查询及根据时间排序的主要内容,如果未能解决你的问题,请参考以下文章

sql模糊查询

如何优化Sql server 大数据量时使用 like 查询的速度?或有啥别的方法实现模糊查询?

asp+access like 模糊查询查不到内容

mongodb 怎么对多个字段模糊查询

求助oracle like%.%模糊查询优化

sql语句中条件查询里in、like、及=三个的效率怎么样?