SQL数据库查询的优化

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL数据库查询的优化相关的知识,希望对你有一定的参考价值。

WEB服务器 上安装的 SQL2005
请问各位 如何使 数据库的查询优化 使其查询速度更快

1,使用合理的表结构,尽量减少表关联,有时宁愿多占用些空间,存储些在别的表中存在的重复字段。

2,合理使用索引。

3,使用存储过程。

4,注意SQL语句的写法。针对“从下而上”解析的数据库系统,将关键性语句条件(比如主键、索引,确定的值等)放置在后面。反之,放置在前面。比如SQLSERVER数据库,你应当将首先去除了大部分记录的条件放置在where的前面部分。
举例:
假设主键为key;创建日期为 c_date,你的条件中包含对key和c_date的范围查询,那么你应当写成:
where
key >= @from_key and key <= @to_key and
c_date >= @from_date and c_date <= @to_date
而不应该写成:
where
key c_date >= @from_date and c_date <= @to_date and
>= @from_key and key <= @to_key

它们速度是不一样的。

以上几点都将提高查询速度!

第二次回答:
有人对第三条“使用存储过程”提高效率有异议,那么请问,你认为存储过程除了可以完成复杂的判断和较复杂的运算、集中控制之外的主要作用是什么?

在运行存储过程前,数据库已对其进行了语法和句法分析,并给出了优化执行方案。这种已经编译好的过程可极大地改善SQL语句的性能。由于执行SQL语句的大部分工作已经完成,所以存储过程能以极快的速度执行。

任何一个设计良好的数据库应用程序都应当尽可能地用到存储过程。

我提到的以上几点,是针对入门者而言,也是比较容易做到的,对于要深入研究这个问题的,那么这些远远不够,但是,做好这些,可以将速度提高一大截了。
参考技术A 3,使用存储过程。是提高查询效率的方法?胡扯 回答问题前自己懂点再回答
单纯的一条查询语句 存储过程能提高效率我把服务器吃下去
对下面的回答补充一点 加内存加cpu能提高性能? 你自己试过没 我可以很负责的告诉你 如过内存和cpu的比例没协调好的话乱加cpu反而会变慢 因为cpu快了就要请求更多的处理 而内存没跟上 反而导致了系统的瓶颈

提高查询效率
合理使用索引(如果需要使用方法那么建立函数索引) 这是最能优化的地方
where结果集少的放前面
提高共享池的命中率 不要追求最高 相对高就行
设置最佳的数据库块的尺寸
必要时建立分区
还有很多
参考技术B 这方面的问题很难用几句话来描述.说是设计合理的表结构,合理使用索引,写高效的查询语句,但什么样的结构设计才是好的?什么样的索引才是合理的?什么样的查询才能够达到高效?
关于SQL数据库的查询优化,很多是要根据自己的经验总结.作为起步来说,我推荐你一本书<数据库系统性能调优--原理与技术>电子工业出版社的,里面讲了一些建表,建索引的样例,还有SQL语句优化的几种典型的情况.
这个书的作者曾经到中国人民大学上过一次课,我也去过,讲的不错,我现在有这个课程的PPT,需要的话可以给你发过去.
参考技术C 这个问题太大了,不懂就加内存,加CPU,用RAID存储。本回答被提问者采纳

SQL 数据库查询的优化工具及实用

本文主要是对数据库查询优化器的一个综述,包括查询优化器分类、查询优化器执行过程和CBO框架Calcite。

 

这是MaxCompute有关SQL优化器原理的系列文章之一,本文主要是对数据库查询优化器的一个综述,包括:

  • 查询优化器定义、分类

  • 查询优化器执行过程

  • CBO框架Calcite简介

 

1.查询优化器是什么


数据库主要由三部分组成,分别是解析器、优化器和执行引擎,如下图所示:



其中优化器是数据库中用于把关系表达式转换成执行计划的核心组件,很大程度上决定了一个系统的性能。


2.查询优化器分类


查询优化器分为两类:基于规则的优化器(Rule-Based Optimizer,RBO) 和基于代价的优化器(Cost-Based Optimizer,CBO) :


基于规则的优化器(Rule-Based Optimizer,RBO)


根据优化规则对关系表达式进行转换,这里的转换是说一个关系表达式经过优化规则后会变成另外一个关系表达式,同时原有表达式会被裁剪掉,经过一系列转换后生成最终的执行计划。

RBO中包含了一套有着严格顺序的优化规则,同样一条SQL,无论读取的表中数据是怎么样的,最后生成的执行计划都是一样的。同时,在RBO中SQL写法的不同很有可能影响最终的执行计划,从而影响脚本性能。


基于代价的优化器(Cost-Based Optimizer,CBO)


根据优化规则对关系表达式进行转换,这里的转换是说一个关系表达式经过优化规则后会生成另外一个关系表达式,同时原有表达式也会保留,经过一系列转换后会生成多个执行计划,然后CBO会根据统计信息和代价模型(Cost Model)计算每个执行计划的Cost,从中挑选Cost最小的执行计划。


由上可知,CBO中有两个依赖:统计信息和代价模型。统计信息的准确与否、代价模型的合理与否都会影响CBO选择最优计划。


从上述描述可知,CBO是优于RBO的,原因是RBO是一种只认规则,对数据不敏感的呆板的优化器,而在实际过程中,数据往往是有变化的,通过RBO生成的执行计划很有可能不是最优的。


事实上目前各大数据库和大数据计算引擎都倾向于使用CBO,例如从Oracle 10g开始,Oracle已经彻底放弃RBO,转而使用CBO;而Hive在0.14版本中也引入了CBO。


3.查询优化器执行过程


无论是RBO,还是CBO都包含了一系列优化规则,这些优化规则可以对关系表达式进行等价转换,常见的优化规则包含:

  • 谓词下推

  • 列裁剪

  • 常量折叠

  • 其他

在这些优化规则的基础上,就能对关系表达式做相应的等价转换,从而生成执行计划。下面将介绍RBO和CBO两种优化器的执行过程。

  • RBO
    RBO的执行过程比较简单,主要包含两个步骤:


1)Transformation
遍历关系表达式,只要模式能够满足特定优化规则就进行转换。


2)Build Physical Plan
经过Step1之后就生成了一个逻辑执行计划,但这只是逻辑上可行,还需要将逻辑执行计划build成物理执行计划,即决定各个Operator的具体实现。如Join算子的具体实现选择BroadcastHashJoin还是SortMergeJoin。

  • CBO
    CBO查询优化主要包含三个步骤:


1)Exploration
根据优化规则进行等价转换,生成等价关系表达式,此时原有关系表达式会被保留。


2)Build Physical Plan
决定各个Operator的具体实现。


3)Find Best Plan
根据统计信息计算各个执行计划的Cost,选择Cost最小的执行计划。


CBO实现有两种模型,即Volcano模型[1]和Cascades模型[2],其中Calcite使用的是Volcano模型,而Orca[3]使用的是Cascades模型。这两种模型的思想基本相同,不同点在于Cascades模型并不是先Explore、后Build,而是边Explore边Build,从而进一步裁剪掉一些执行计划。在这里就不展开了,对此感兴趣的同学可以看下相关的论文。


4.CBO框架Calcite简介


Apache Calcite 是一个独立于存储与执行的SQL优化引擎,广泛应用于开源大数据计算引擎中,如Flink、Drill、Hive、Kylin等。另外,MaxCompute也使用了Calcite作为优化器框架。Calcite的架构如下图所示:


SQL 数据库查询的优化工具及实用


其中Operator Expressions 指的是关系表达式,一个关系表达式在Calcite中被表示为RelNode,往往以根节点代表整个查询树。Calcite中有两种方法生成RelNode:


  • 通过Parser直接解析生成

从上述架构图可以看到,Calcite也提供了Parser用于SQL解析,直接使用Parser就能得到RelNode Tree。

  • 通过Expressions Builder转换生成

不同系统语法有差异,所以Parser也可能不同。针对这种情况,Calcite提供了Expressions Builder来对抽象语法树(或其他数据结构)进行转换得到RelNode Tree。如Hive(某一种Data Processing System)使用的就是这种方法。


Query Optimizer 根据优化规则(Pluggable Rules)对Operator Expressions进行一系列的等价转换,生成不同的执行计划,最后选择代价最小的执行计划,其中代价计算时会用到Metadata Providers提供的统计信息。


事实上,Calcite提供了RBO和CBO两种优化方式,分别对应HepPlanner和VolcanoPlanner。对此,本文也不进行展开,后续有时间再详细介绍Calcite的具体实现。


5.总结


本文是对查询优化器的一个综述,介绍了查询优化器的分类、执行过程,以及优化器通用框架Calcite。


6.参考


 [1] The Volcano Optimizer Generator: Extensibility and Efficient Search

 [2] The Cascades Framework for Query Optimization

 [3] Orca: A Modular Query Optimizer Architecture for Big Data

 




更多技术干货分享


以上是关于SQL数据库查询的优化的主要内容,如果未能解决你的问题,请参考以下文章

SQL查询优化

SQL数据库查询的优化

SQL优化----百万数据查询优化

如何优化 SQL 查询(Oracle 数据库)

数据库查询优化器的艺术:原理解析与SQL性能优化

优化SQL查询sql