数据库第七篇：数据库优化建表优化

Posted 2021-05-01 软件测试面试汇总

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据库第七篇：数据库优化建表优化相关的知识，希望对你有一定的参考价值。

数据库优化

2）数据类型选择l数字类型Float和double选择（尽量选择float）区分开TINYINT/INT/BIGINT，能确定不会使用负数的字段，建议添加unsigned定义能够用数字类型的字段尽量选择数字类型而不用字符串类型的l字符类型char,varchar,TEXT的选择：非万不得已不要使用TEXT数据类型，定长字段，建议使用CHAR类型（填空格），不定长字段尽量使用VARCHAR（自动适应长度，超过阶段），且仅仅设定适当的最大长度l时间类型按选择优先级排序DATE（精确到天）、TIMESTAMP、DATETIME（精确到时间）lENUM对于状态字段，可以尝试使用ENUM来存放l避免使用NULL字段，很难查询优化且占用额外索引空间

3）字符编码同样的内容使用不同字符集表示所占用的空间大小会有较大的差异，所以通过使用合适的字符集，可以帮助我们尽可能减少数据量，进而减少IO操作次数。

1 1.纯拉丁字符能表示的内容，选择latin1字符编码

2 2.中文可选用utf-8

3 的数据类型可以精确到字段，所以当我们需要大型数据库中存放多字节数据的时候，可以通过对不同表不同字段使用不同的数据类型来较大程度减小数据存储量，进而降低IO操作次数并提高缓存命中率

Sql优化

索引优化

一、创建索引，以下情况不适合建立索引l表记录太少l经常插入、删除、修改的表l数据重复且分布平均的表字段二、复合索引如果一个表中的数据在查询时有多个字段总是同时出现则这些字段就可以作为复合索引

索引

索引是对数据库表中一列或多列的值进行排序的一种结构。优点：l大大加快数据的检索速度l创建唯一性索引，保证数据库表中每一行数据的唯一性l可以加速表和表之间的连接

缺点：l索引需要占物理空间。l当对表中的数据进行增加、删除和修改的时候，索引也要动态的维护，降低了数据的维护速度。

索引分类：l普通索引createindexzjj_temp_index_1onzjj_temp_1(first_name);dropindexzjj_temp_index_1;l唯一索引，索引列的值必须唯一，但允许有空值createuniqueindexzjj_temp_1onzjj_temp_1(id);l主键索引，它是一种特殊的唯一索引，不允许有空值。l组合索引

事务

数据库事务(DatabaseTransaction)，是指作为单个逻辑工作单元执行的一系列操作，要么完全地执行，要么完全地不执行。

四大特征：

1 (1)原子性事务必须是原子工作单元；对于其数据修改，要么全都执行，要么全都不执行。

2 (2)一致性事务的一致性指的是在一个事务执行之前和执行之后数据库都必须处于一致性状态。事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。

(3)隔离性（关于事务的隔离性数据库提供了多种隔离级别）一个事务的执行不能干扰其它事务。即一个事务内部的操作及使用的数据对其它并发事务是

隔离的，并发执行的各个事务之间不能互相干扰。

3 (4)持久性事务完成之后，它对于数据库中的数据改变是永久性的。该修改即使出现系统故障也将一直保持。在介绍数据库提供的各种隔离级别之前，我们先看看如果不考虑事务的隔离性，会发生的几种问题：l脏读脏读是指在一个事务处理过程里读取了另一个未提交的事务中的数据。l不可重复读l幻读幻读和不可重复读都是读取了另一条已经提交的事务,不可重复读重点在于update和delete，而幻读的重点在于insert。在可重复读中，该sql第一次读取到数据后，就将这些数据加锁，其它事务无法修改这些数据，就可以实现可重复读了。但这种方法却无法锁住insert的数据，所以当事务A先前读取了数据，或者修改了全部数据，事务B还是可以insert数据提交，这时事务A就会发现莫名其妙多了一条之前没有的数据，这就是幻读，不能通过行锁来避免。需要Serializable隔离级别，读用读锁，写用写锁，读锁和写锁互斥，这么做可以有效的避免幻读、不可重复读、脏读等问题，但会极大的降低数据库的并发能力。

现在来看看mysql数据库为我们提供的四种隔离级别：

①Serializable(串行化)：可避免脏读、不可重复读、幻读的发生。

②Repeatableread(可重复读)：可避免脏读、不可重复读的发生。

③Readcommitted(读已提交)：可避免脏读的发生。

④Readuncommitted(读未提交)：最低级别，任何情况都无法保证。

在MySQL数据库中默认的隔离级别为Repeatableread(可重复读)。

锁模式包括：l共享锁:（读取）操作创建的锁。其他用户可以并发读取数据，但任何事物都不能获取数据上的排它锁，直到已释放所有共享锁。l排他锁（X锁）：对数据A加上排他锁后，则其他事务不能再对A加任任何类型的封锁。获准排他锁的事务既能读数据，又能修改数据。l更新锁:更新(U)锁可以防止通常形式的死锁。如果两个事务获得了资源上的共享模式锁，然后试图同时更新数据，则两个事务需都要转换共享锁为排它(X)锁，并且每个事务都等待另一个事务释放共享模式锁，因此发生死锁。若要避免这种潜在的死锁问题，请使用更新(U)锁。一次只有一个事务可以获得资源的更新(U)锁。如果事务修改资源，则更新(U)锁转换为排它(X)锁。否则，锁转换为共享锁。

锁的粒度主要有以下几种类型：l行锁：粒度最小，并发性最高l页锁：一次锁定一页。25个行锁可升级为一个页锁。l表锁：粒度大，并发性低l 数据库锁：控制整个数据库操作

乐观锁：相对悲观锁而言，乐观锁假设认为数据一般情况下不会造成冲突，所以在数据进行提交更新的时候，才会正式对数据的冲突与否进行检测，如果发现冲突了，则让返回用户错误的信息，让用户决定如何去做。一般的实现乐观锁的方式就是记录数据版本。悲观锁：顾名思义，就是很悲观，每次去拿数据的时候都认为别人会修改，所以每次在拿数据的时候都会上锁，这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制，比如行锁，表锁等，读锁，写锁等，都是在做操作之前先上锁。

索引

MyISAM、InnoDB区别lMyISAM类型不支持事务处理等高级处理，而InnoDB类型支持。lMyISAM表不支持外键，InnoDB支持lMyISAM锁的粒度是表级，而InnoDB支持行级锁定。lMyISAM支持全文类型索引，而InnoDB不支持全文索引。(mysql5.6后innodb支持全文索引)MyISAM相对简单，所以在效率上要优于InnoDB，小型应用可以考虑使用MyISAM。当你的数据库有大量的写入、更新操作而查询比较少或者数据完整性要求比较高的时候就选择innodb表。当你的数据库主要以查询为主，相比较而言更新和写入比较少，并且业务方面数据完整性要求不那么严格，就选择mysiam表。

MyISAM和InnoDB索引实现：

InnoDB索引实现

然InnoDB也使用B+Tree作为索引结构，但具体实现方式却与MyISAM截然不同.l主索引InnoDB表数据文件本身就是主索引。InnoDB主索引（同时也是数据文件）的示意图，可以看到叶节点包含了完整的数据记录。这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集，所以InnoDB要求表必须有主键（MyISAM可以没有），如果没有显式指定，则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键，如果不存在这种列，则MySQL自动为InnoDB表生成一个隐含字段作为主键，这个字段长度为6个字节，类型为长整形。

l辅助索引InnoDB的所有辅助索引都引用主键作为data域。

聚集索引这种实现方式使得按主键的搜索十分高效，但是辅助索引搜索需要检索两遍索引：首先检索辅助索引获得主键，然后用主键到主索引中检索获得记录。

不同存储引擎的索引实现方式对于正确使用和优化索引都非常有帮助，例如知道了InnoDB的索引实现后，就很容易明白1、为什么不建议使用过长的字段作为主键，因为所有辅助索引都引用主索引，过长的主索引会令辅助索引变得过大。再例如，2、用非单调的字段作为主键在InnoDB中不是个好主意，因为InnoDB数据文件本身是一颗B+Tree，非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整，十分低效，而使用自增字段作为主键则是一个很好的选择。

红黑树B树B+树B-树

二叉查找树（BST）：二叉排序树或者是一棵空树，或者是具有下列性质的二叉树：l若左子树不空，则左子树上所有结点的值均小于它的根结点的值。l若右子树不空，则右子树上所有结点的值均大于它的根结点的值。l左、右子树也分别为二叉排序树。l没有键值相等的节点（因此，插入的时候一定是叶子节点）。

删除算法l要删除节点是叶子节点。l要删除的节点只有一个孩子（左孩子或右孩子），这种情况比较简单，只需要将该孩子连接到当前节点的父节点即可。l要删除的节点有两个孩子，这个时候的算法就比较复杂（相比较于只有一个孩子的情况）。首先我们需要找到待删除节点的左子树上的最大值节点，或者右子树上的最小值节点，然后将该节点的参数值与待删除的节点参数值进行交换，最后删除该节点，这样需要删除的参数就从该二叉树中删除了。

红黑树：

红黑树（RedBlackTree）是一种自平衡二叉查找树：l每个节点或者是黑色，或者是红色。l根节点是黑色。l每个叶子节点是黑色。l如果一个节点是红色的，则它的子节点必须是黑色的。l从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。

红黑树的各种操作的时间复杂度是O（log2N）。

红黑树vsAVL红黑树的查询性能略微逊色于AVL树，因为他比avl树会稍微不平衡最多一层，也就是说红黑树的查询性能只比相同内容的avl树最多多一次比较，但是，红黑树在插入和删除上完爆avl树，avl树每次插入删除会进行大量的平衡度计算，而红黑树为了维持红黑性质所做的红黑变换和旋转的开销，相较于avl树为了维持平衡的开销要小得多

插入操作红父

如果新节点的父结点为红色，这时就需要进行一系列操作以保证整棵树红黑性质。如下图所示，由于父结点为红色，此时可以判定，祖父结点必定为黑色。这时需要根据叔父结点的颜色来决定做什么样的操作。青色结点表示颜色未知。由于有可能需要根结点到新点的路径上进行多次旋转操作，而每次进行不平衡判断的起始点（我们可将其视为新点）都不一样。所以我们在此使用一个蓝色箭头指向这个起始点，并称之为判定点。

l 红叔当叔父结点为红色时，如下图所示，无需进行旋转操作，只要将父和叔结点变为黑色，将祖父结点变为红色即可。但由于祖父结点的父结点有可能为红色，从而违反红黑树性质。此时必须将祖父结点作为新的判定点继续向上（迭代）进行平衡操作。需要注意的是，无论“父节点”在“叔节点”的左边还是右边，无论“新节点”是“父节点”的左孩子还是右孩子，它们的操作都是完全一样的（其实这种情况包括4种，只需调整颜色，不需要旋转树形）。l黑叔当叔父结点为黑色时，需要进行旋转，以下图示了所有的旋转可能：

Case 1:

Case 2:

Case 3:

Case 4:

B 树与B-树：

B-tree树即B树，B即Balanced，平衡的意思。因为B树的原英文名称为B-tree，而国内很多人喜欢把B-tree译作B-树，其实，这是个非常不好的直译，很容易让人产生误解。如人们可能会以为B-树是一种树，而B树又是另一种树。而事实上是，B-tree就是指的B树。

m阶B树是一棵平衡的m路搜索树。它是空树，或者是满足下列性质的树：l根结点的儿子数为[2,M]；l除根结点以外的非叶子结点的儿子数为[M/2,M]；（M/2向上取整）l每个结点存放至少M/2-1（取上整）和至多M-1个关键字；l非叶子结点的关键字个数=指向儿子的指针个数-1；l非叶子结点的关键字：K[1],K[2],…,K[X-1]；且K[i]<K[i+1]；l非叶子结点的指针：P[1],P[2],…,P[X]；其中P[1]指向关键字小于K[1]的子树，P[X]指向关键字大于K[X-1]的子树，其它P[i]指向关键字属于(K[i-1],K[i])的子树；l所有叶子结点位于同一层；

B+树：

B+树是B-树的变体，也是一种多路搜索树：其定义基本与B-树同，除了：l非叶子结点的子树指针与关键字个数相同；l非叶子结点的子树指针P[i]，指向关键字值属于[K[i],K[i+1])的子树（B-树是开区间）；l为所有叶子结点增加一个指针链；l所有关键字都在叶子结点出现；

基本SQL操作

lSELECT*FROMtableORDERBYfieldDESC;(ASC|DESC)SELECTDISTINCTfieldfromtablewhere范围lINSERTINTOtable_name(column1,column2,column3,...)VALUES(value1,value2,value3,...);lUPDATEtable_nameSETcolumn1=value1,column2=value2,...WHEREsome_column=some_value;lDELETEFROMtable_nameWHEREsome_column=some_value;

LIKE操作符SELECTcolumn_name(s)FROMtable_nameWHEREcolumn_nameLIKEpattern;IN操作符SELECTcolumn_name(s)FROMtable_nameWHEREcolumn_nameIN(value1,value2,...);BETWEEN操作符SELECTcolumn_name(s)FROMtable_nameWHEREcolumn_nameBETWEENJOIN

左连接，右连接，内连接leftjoin(左联接)：返回包括左表中的所有记录和右表中联结字段相等的记录。rightjoin(右联接)：返回包括右表中的所有记录和左表中联结字段相等的记录。innerjoin(等值连接)：只返回两个表中联结字段相等的行。（默认）UNION操作符

UNION操作符用于合并两个或多个SELECT语句的结果集。SELECTcountry,nameFROMWebsitesWHEREcountry='CN'UNIONSELECTcountry,app_nameFROMappsWHEREcountry='CN'ORDERBYcountry;

创建视图

CREATEVIEWview_nameASSELECTcolumn_name(s)FROMtable_nameWHEREcondition

SQL函数

Avg()Count()Max()Min()Sum()GroupBy():GROUPBY语句用于结合聚合函数，根据一个或多个列对结果集进行分组。SELECTcolumn_name,aggregate_function(column_name)FROMtable_nameWHEREcolumn_nameoperatorvalueGROUPBYcolumn_name;HAVING子句可以让我们筛选分组后的各组数据。SELECTcolumn_name,aggregate_function(column_name)FROMtable_nameWHEREcolumn_nameoperatorvalueGROUPBYcolumn_nameHAVINGaggregate_function(column_name)operatorvalue;

如何查询数据库表结构，主键

desctabl_name;

建表CREATETABLE表名称(列名称1数据类型,....)

一起成长，一起分享，希望能对您有所帮助，我们是TestMadman,期待您的关注。

以上是关于数据库第七篇：数据库优化建表优化的主要内容，如果未能解决你的问题，请参考以下文章

第七篇：双管齐下，JVM内部优化与JVM性能调优

数据库优化建表优化

第七章：数据挖掘建模的优化和限度

ClickHouse-尚硅谷（9. 高级-建表优化）学习笔记

ClickHouse学习-建表和索引的优化点