面试官：你来说说，数据库自增 ID 用完了会咋样？

Posted 2021-08-15 king哥Java架构

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了面试官：你来说说，数据库自增 ID 用完了会咋样？相关的知识，希望对你有一定的参考价值。

01 前言

哈喽，好久没更新啦。因为最近在面试。用了两周时间准备，在 3 天之内拿了 5 个 offer，最后选择了广州某互联网行业独角兽 offer，昨天刚入职。这几天刚好整理下在面试中被问到有意思的问题，也借此机会跟大家分享下。

这家企业的面试官有点意思，一面是个同龄小哥，一起聊了两个小时（聊到我嘴都干了）。他问了我一个有意（keng）思（b）问题：

数据库中的自增 ID 用完了该怎么办？

这个问题其实可以分为有主键 & 无主键两种情况回答。

国际惯例，先上张脑图：

02 有主键

如果你的表有主键，并且把主键设置为自增。

在 mysql 中，一般会把主键设置成 int 型。而 MySQL 中 int 型占用 4 个字节，作为有符号位的话范围就是 [-2^31,231-1]，也就是[-2147483648,2147483647]；无符号位的话最大值就是 2^32-1，也就是 4294967295。

下面以有符号位创建一张表：

CREATE TABLE IF NOT EXISTS `t`(
   `id` INT(11) NOT NULL AUTO_INCREMENT,
   `url` VARCHAR(64) NOT NULL,
   PRIMARY KEY ( `id` )
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入一个 id 为最大值 2147483647 的值，如下图所示：

如果此时继续下面的插入语句：

INSERT INTO t (url) VALUES ('wwww.javafish.top/article/erwt/spring')

结果就会造成主键冲突：

2.1 解决方案

虽说 int 4 个字节，最大数据量能存储 21 亿。你可能会觉得这么大的容量，应该不至于用完。但是互联网时代，每天都产生大量的数据，这是很有可能达到的。

所以，我们的解决方案是：把主键类型改为 bigint，也就是 8 个字节。这样能存储的最大数据量就是 2^64-1，我也数不清有多少了。反正在你有生之年应该是够用的。

PS：单表 21 亿的数据量显然不现实，一般来说数据量达到 500 万就该分表了。

03 没主键

另一种情况就是建表时没设置主键。这种情况，InnoDB 会自动帮你创建一个不可见的、长度为 6 字节的 row_id，默认是无符号的，所以最大长度是 2^48-1。

实际上 InnoDB 维护了一个全局的 dictsys.row_id，所以未定义主键的表都共享该 row_id，并不是单表独享。每次插入一条数据，都把全局 row_id 当成主键 id，然后全局 row_id 加 1。

这种情况的数据库自增 ID 用完会发生什么呢？

1、创建一张无显示设置主键的表 t：

CREATE TABLE IF NOT EXISTS `t`(
   `age` int(4) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、通过 ps -ef|grep mysql 命令获取 mysql 的进程 ID，然后执行命令，通过 gdb 先把 row_id 修改为 1。PS：没有 gdb 的，百度安装下

sudo gdb -p 16111 -ex 'p dict_sys->row_id=1' -batch

出现下图就是没错的：

3、插入三条数据：

insert into t(age) values(1);
insert into t(age) values(2);
insert into t(age) values(3);

此时的数据库数据：

4、gdb 把 row_id 修改为最大值：281474976710656

sudo gdb -p 16111 -ex 'p dict_sys->row_id=281474976710656' -batch

5、再插入三条数据：

insert into t(age) values(4);
insert into t(age) values(5);
insert into t(age) values(6);

此事的数据库数据：

分析：

刚开始设置 row_id 为 1，插入三条数据 1、2、3 的 row_id 也理应是 1、2、3；这是没问题的。
接着设置 row_id 为最大值，紧跟着插入三条数据。这时的数据库结果是：4、5、6、3；你会发现 1、2 被覆盖了。
row_id 达到后最大值后插入的值 4、5、6 的 row_id 分别是 0、1、2；由于 row_id 为 1、2 的值已存在，所以后者的值 5、6 会覆盖掉 row_id 为 1、2 的值。

结论：row_id 达到最大值后会从 0 重新开始算；前面插入的数据就会被后插入的数据覆盖，且不会报错。

04 总结

数据库自增主键用完后分两种情况：

有主键，报主键冲突
无主键，InnDB 会自动生成一个全局的row_id。它到达最大值后会从 0 开始算，遇到 row_id 一样时，新数据覆盖旧数据。所以，我们还是尽量给表设置主键。

为什么我说这是个有意（keng）思（b）问题？

我的回答除了以上解决方法外，还提到在业务开发中，我们不会等到主键用完那天就已经分库分表了，基本不会遇到这种情况。

这时，面试官可能会问你分库分表咋处理，如果你不会就不要主动提了，点到即止。

一直想整理出一份完美的面试宝典，但是时间上一直腾不开，这套一千多道面试题宝典，结合今年金三银四各种大厂面试题，以及 GitHub 上 star 数超 30K+ 的文档整理出来的，我上传以后，毫无意外的短短半个小时点赞量就达到了 13k，说实话还是有点不可思议的。

一千道互联网 Java 工程师面试题

内容涵盖：Java、MyBatis、ZooKeeper、Dubbo、Elasticsearch、Memcached、Redis、MySQL、Spring、SpringBoot、SpringCloud、RabbitMQ、Kafka、Linux等技术栈（485页）

初级—中级—高级三个级别的大厂面试真题

阿里云——Java 实习生/初级

List 和 Set 的区别 HashSet 是如何保证不重复的

HashMap 是线程安全的吗，为什么不是线程安全的（最好画图说明多线程环境下不安全）?

HashMap 的扩容过程

HashMap 1.7 与 1.8 的区别，说明 1.8 做了哪些优化，如何优化的？

对象的四种引用

Java 获取反射的三种方法

Java 反射机制

Arrays.sort 和 Collections.sort 实现原理和区别

Cloneable 接口实现原理

异常分类以及处理机制

wait 和 sleep 的区别

数组在内存中如何分配

答案展示：

美团——Java 中级

BeanFactory 和 ApplicationContext 有什么区别

Spring Bean 的生命周期

Spring IOC 如何实现

说说 Spring AOP

Spring AOP 实现原理

动态代理（cglib 与 JDK）

Spring 事务实现方式

Spring 事务底层原理

如何自定义注解实现功能

Spring MVC 运行流程

Spring MVC 启动流程

Spring 的单例实现原理

Spring 框架中用到了哪些设计模式

为什么选择 Netty

说说业务中，Netty 的使用场景

原生的 NIO 在 JDK 1.7 版本存在 epoll bug

什么是 TCP 粘包/拆包

TCP 粘包/拆包的解决办法

Netty 线程模型

说说 Netty 的零拷贝

Netty 内部执行流程

答案展示：

蚂蚁金服——Java 高级

题 1：

jdk1.7 到 jdk1.8 Map 发生了什么变化(底层)?

ConcurrentHashMap

并行跟并发有什么区别？

jdk1.7 到 jdk1.8 java 虚拟机发生了什么变化?

如果叫你自己设计一个中间件,你会如何设计?

什么是中间件？

ThreadLock 用过没有,说说它的作用?

Hashcode（）和 equals（）和==区别?

mysql 数据库中,什么情况下设置了索引但无法使用?

mysql 优化会不会,mycat 分库,垂直分库,水平分库?

分布式事务解决方案?

sql 语句优化会不会,说出你知道的?

mysql 的存储引擎了解过没有?

红黑树原理？