数据库面试葵花宝典

Posted 2020-10-11 Qiao_Zhi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据库面试葵花宝典相关的知识，希望对你有一定的参考价值。

你目前接触的mysql版本是什么？除了官方版本，还接触过其他的mysql分支版本嘛？

产生分支的原因

许多开发人员认为有必要将其拆分成其他项目，并且每个分支项目都有自己的专长。该需求以及Oracle对核心产品增长缓慢的担忧，导致出现了许多开发人员感兴趣的子项目和分支

三个流行MySQL分支：Drizzle、MariaDB和Percona Server（包括XtraDB引擎）

MariaDB不仅是mysql的替代品，主要还是创新和提高mysql自有技术。

新功能介绍

multi-source replication 多源复制
表的并行复制
galera cluster集群
spider水平分片
tokuDB存储引擎

XtraDB是innodb存储引擎的增强版，可用来更好地发挥最新的计算机硬件系统性能，还包含在高性能模式下的新特性。它可以向下兼容，因为它是在innodb基础上构建，所以他有更多的指标和扩展功能。而且它在cpu多核的条件下，可以更好地使用内存，时数据库性能提到更高！

Drizzle与mysql的差别就比较大了，并且不能兼容，如果想运行此环境，就需要重写一些代码了！

Question 2:

mysql主要的存储引擎myisam和innodb的不同之处？

事务的支持不同（innodb支持事务，myisam不支持事务）
锁粒度（innodb行锁应用，myisam表锁）
存储空间（innodb既缓存索引文件又缓存数据文件，myisam只能缓存索引文件）
存储结构

（myisam：数据文件的扩展名为.MYD myData ，索引文件的扩展名是.MYI myIndex）

（innodb：所有的表都保存在同一个数据文件里面即为.Ibd）

5. 统计记录行数

（myisam：保存有表的总行数，select count(*) from table;会直接取出出该值）

（innodb：没有保存表的总行数，select count(*) from table；就会遍历整个表，消耗相当大）

Question 3：

Innodb的体系结构简单介绍一下？

谈及到innodb的体系结构，首先要考虑mysql的体系结构，分为两部分mysql的server层和存储引擎层

先要跟面试官聊清楚mysql的整体方向，然后再去涉及innodb体系结构

建议从三方面介绍innodb体系结构：内存----线程-----磁盘

内存中包含insert_buffer,data_buffer,index_buffer,redo_log_buffer,double_write

内存刷新到磁盘的机制，redo，脏页，binlog的刷新条件

各种线程的作用，master_thread,purge_thread,redo log thread,read thread,write thread,page cleaner thread

磁盘中存放着数据文件，redo log，undo log，binlog

Question 4：

mysql有哪些索引类型：

数据结构角度上可以分：B+tree索引，hash索引，fulltext索引（innodb，myisam都支持）
存储角度上可以分：聚集索引，非聚集索引
逻辑角度上可以分：primary key，normal key，单列，复合，覆盖索引

Question 5：

mysql binlog有几种格式：

1. statement

优点：不需要记录每一行的变化，减少了binlog日志量，节约了IO，提高性能

缺点：当使用一些特殊函数的时候，或者跨库操作的时候容易丢失数据

注：在生产中不建议使用

2. row

优点：清晰记录每行的数据信息，不会出现跨库丢数据的情况

缺点：内容当记录到日志中的时候，都将以每行记录的修改来记录，但就会产生大量的binlog，对于网络开销也比较大

注：生产中推荐使用

3. mixed

是mysql5.1的时候，一个过渡版本，DDL语句会记录成statement，DML会记录row。

注：生产中不建议使用

Qusetion 6：

mysql主从复制的具体原理是什么？

主服务器把数据更新记录到二进制日志中，从服务器通过io thread向主库发起binlog请求，主服务器通过IO dump thread把二进制日志传递给从库，从库通过io thread记录到自己的中继日志中。然后再通过sql thread应用中继日志中sql的内容。

Qusetion 7：

数据库中双一是什么？

sync_binlog=1

innodb_flush_log_at_trx_commit=1

innodb_flush_log_at_trx_commit和sync_binlog 两个参数是控制MySQL 磁盘写入策略以及数据安全性的关键参数

innodb_flush_log_at_trx_commit设置为1，每次事务提交时MySQL都会把log buffer的数据写入log file，并且刷到磁盘中去。

sync_binlog =N (N>0) ，MySQL 在每写 N次二进制日志binary log时，会使用fdatasync()函数将它的写二进制日志binary log同步到磁盘中去

Qusetion 8：

如何监控mysql replication复制延迟？

可以通过第三方工具业界中的瑞士军刀percona-toolkit中的命令，pt-heartbeat进行主从延迟监控。
传统方法，通过比较主从服务器之间的position号的差异值。
还可以通过查看seconds_behind_master估算一下主从延迟时间

Qusetion 9：

大表DDL语句，如何实施，才能把性能影响降到最低？

可以通过传统方法导入导出数据，新建一张与原表一样的表结构，把需要执行的ddl语句在无数据的新表执行，然后把老表中的数据导入到新表中，把新表改成老表的名字
通过第三方工具业界中的瑞士军刀percona-toolkit中的命令，pt-online-schema-change进行在线操作
对于新版本的mysql（5.7）可以直接在线online ddl

Qusetion 10：

为什么要为innodb表设置自增列做主键？

1.使用自增列做主键，写入顺序是自增的，和B+数叶子节点分裂顺序一致

2.表不指定自增列做主键，同时也没有可以被选为主键的唯一索引，InnoDB就会选择内置的rowid作为主键，写入顺序和rowid增长顺序一致

所以InnoDB表的数据写入顺序能和B+树索引的叶子节点顺序一致的话，这时候存取效率是最高

Qusetion 11：

如何优化一条有问题的sql语句？

针对sql语句的优化，我们不要上来就回答添加索引，这样显得太不专业。我们可以从如下几个角度去分析

回归到表的设计层面，数据类型选择是否合理
大表碎片的整理是否完善
表的统计信息，是不是准确的
审查表的执行计划，判断字段上面有没有合适的索引
针对索引的选择性，建立合适的索引（就又涉及到大表DDL的操作问题）

Qusetion 12：

服务器负载过高或者网页打开缓慢，简单说说你的优化思路？

首先我们要发现问题的过程，通过操作系统，数据库，程序设计，硬件角度四个维度找到问题所在
找到瓶颈点的位置
制定好优化方案，形成处理问题的体系
体系制定好之后，在测试环境进行优化方案的测试
测试环境如果优化效果很好，再实施到生产环境
做好处理问题的记录

Qusetion 13：

接触过哪些mysql的主流架构？架构应用中有哪些问题需要考虑？

M-S
MHA
MM keepalived
PXC

共同存在的问题：主从延迟问题的存在，在主库宕机，切换过程中要考虑数据一致性的问题，避免出现主从复制不一致

Qusetion14：

什么是死锁？锁等待？如何优化这类问题？通过数据库哪些表可以监控？

死锁是指两个或多个事务在同一资源上互相占用，并请求加锁时，而导致的恶性循环现象。当多个事务以不同顺序试图加锁同一资源时，就会产生死锁。

锁等待：mysql数据库中，不同session在更新同行数据中，会出现锁等待

重要的三张锁的监控表innodb_trx，innodb_locks，innodb_lock_waits

Qusetion 15：

处理过mysql哪些案例

我们可以简单从mysql四个知识模块跟他聊聊mysql体系结构，数据备份恢复，优化，高可用集群架构

mysql版本的升级
处理mysql集群的各种坑和问题
根据公司业务类型，设计合理mysql库，表，架构。
定期进行灾备恢复演练
误删除数据之后，恢复数据

以上是关于数据库面试葵花宝典的主要内容，如果未能解决你的问题，请参考以下文章

大数据面试葵花宝典之Kafka进阶

Redis 面试宝典之 Redis 如何处理已经过期的数据？

新书出版 |《数据库程序员面试笔试宝典》

java面试宝典（蓝桥学院）

面试之葵花宝典

有了这份Java面试中的葵花宝典，让你面试起飞！！！