面试官:数据库自增 ID 用完了会咋样?

Posted JAVA炭烧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了面试官:数据库自增 ID 用完了会咋样?相关的知识,希望对你有一定的参考价值。

01 前言

哈喽,好久没更新啦。因为最近在面试。用了两周时间准备,在 3 天之内拿了 5 个 offer,最后选择了广州某互联网行业独角兽 offer,昨天刚入职。这几天刚好整理下在面试中被问到有意思的问题,也借此机会跟大家分享下。

这家企业的面试官有点意思,一面是个同龄小哥,一起聊了两个小时(聊到我嘴都干了)。他问了我一个有意(keng)思(b)问题:

数据库中的自增 ID 用完了该怎么办?

这个问题其实可以分为有主键 & 无主键两种情况回答。

国际惯例,先上张脑图:

02 有主键

如果你的表有主键,并且把主键设置为自增。

mysql 中,一般会把主键设置成 int 型。而 MySQL 中 int 型占用 4 个字节,作为有符号位的话范围就是 [-231,231-1],也就是[-2147483648,2147483647];无符号位的话最大值就是 2^32-1,也就是 4294967295。

下面以有符号位创建一张表:

CREATE TABLE IF NOT EXISTS `t`(
   `id` INT(11) NOT NULL AUTO_INCREMENT,
   `url` VARCHAR(64) NOT NULL,
   PRIMARY KEY ( `id` )
)ENGINE=InnoDB DEFAULT CHARSET=utf8; 

插入一个 id 为最大值 2147483647 的值,如下图所示:

如果此时继续下面的插入语句:

INSERT INTO t (url) VALUES ('wwww.javafish.top/article/erwt/spring') 

结果就会造成主键冲突:

2.1 解决方案

虽说 int 4 个字节,最大数据量能存储 21 亿。你可能会觉得这么大的容量,应该不至于用完。但是互联网时代,每天都产生大量的数据,这是很有可能达到的。

所以,我们的解决方案是:把主键类型改为 bigint,也就是 8 个字节。这样能存储的最大数据量就是 2^64-1,我也数不清有多少了。反正在你有生之年应该是够用的。

PS:单表 21 亿的数据量显然不现实,一般来说数据量达到 500 万就该分表了

03 没主键

另一种情况就是建表时没设置主键。这种情况,InnoDB 会自动帮你创建一个不可见的、长度为 6 字节的 row_id,默认是无符号的,所以最大长度是 2^48-1。

实际上 InnoDB 维护了一个全局的 dictsys.row_id,所以未定义主键的表都共享该 row_id,并不是单表独享。每次插入一条数据,都把全局 row_id 当成主键 id,然后全局 row_id 加 1。

这种情况的数据库自增 ID 用完会发生什么呢?

1、创建一张无显示设置主键的表 t:

CREATE TABLE IF NOT EXISTS `t`(
   `age` int(4) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8; 

2、通过 ps -ef|grep mysql 命令获取 mysql 的进程 ID,然后执行命令,通过 gdb 先把 row_id 修改为 1。PS:没有 gdb 的,百度安装下

sudo gdb -p 16111 -ex 'p dict_sys->row_id=1' -batch 

出现下图就是没错的:

3、插入三条数据:

insert into t(age) values(1);
insert into t(age) values(2);
insert into t(age) values(3); 

此时的数据库数据:

4、gdb 把 row_id 修改为最大值:281474976710656

sudo gdb -p 16111 -ex 'p dict_sys->row_id=281474976710656' -batch 

5、再插入三条数据:

insert into t(age) values(4);
insert into t(age) values(5);
insert into t(age) values(6); 

此事的数据库数据:

分析:

  • 刚开始设置 row_id 为 1,插入三条数据 1、2、3 的 row_id 也理应是 1、2、3;这是没问题的。

  • 接着设置 row_id 为最大值,紧跟着插入三条数据。这时的数据库结果是:4、5、6、3;你会发现 1、2 被覆盖了。

  • row_id 达到后最大值后插入的值 4、5、6 的 row_id 分别是 0、1、2;由于 row_id 为 1、2 的值已存在,所以后者的值 5、6 会覆盖掉 row_id 为 1、2 的值。

结论:row_id 达到最大值后会从 0 重新开始算;前面插入的数据就会被后插入的数据覆盖,且不会报错。

04 总结

数据库自增主键用完后分两种情况:

  • 有主键,报主键冲突
  • 无主键,InnDB 会自动生成一个全局的row_id。它到达最大值后会从 0 开始算,遇到 row_id 一样时,新数据覆盖旧数据。所以,我们还是尽量给表设置主键

为什么我说这是个有意(keng)思(b)问题?

我的回答除了以上解决方法外,还提到在业务开发中,我们不会等到主键用完那天就已经分库分表了,基本不会遇到这种情况。

这时,面试官可能会问你分库分表咋处理,如果你不会就不要主动提了,点到即止。

05 大厂面试题 & 电子书

如果看到这里,喜欢这篇文章的话,请帮点个好看

初次见面,也不知道送你们啥。干脆就送几百本电子书2021最新java学习资料吧。

面试题都是有答案的,详细如下所示:有需要的就来拿吧,绝对免费,无套路获取

近日,经过一朋友的透露,Alibaba也首发了一份限量的“Java成长手册”,里面记载的知识点非常齐全,看完之后才知道,差距真的不止一点点!

手册主要是将Java程序员按照年限来进行分层,清晰的标注着Java程序员应该按照怎样的路线来提升自己,需要去学习哪些技术点。

0-1年入门:

  • Java基础复盘 (面向对象+Java的超类+Java的反射机制+异常处理+集合+泛型+基础IO操作+多线程+网络编程+JDK新特性)
  • Web编程初探 (Servlet+MySQL数据库+商品管理系统实战)
  • SSM从入门到精通 (Spring+SpringMVC+Mybatis+商品管理系统实战-SSM版)
  • SpringBoot快速上手 (SpringBoot+基于SpringBoot的商品管理系统实战)
  • 零距离互联网项目实战 (Linux+Redis+双十一秒杀实战系统)

1-3年高工:

  • 并发编程进阶 (并发工具类实战+CAS+显示锁解析+线程池内部机制+性能优化)
  • JVM深度剖析 (理解运行时数据区+堆外内存解读+JDK+内存泄漏问题排查+Arthas+GC算法和垃圾回收器+类加载机制)
  • MySQL深度进阶
  • 深入Tomcat底层 (线程模型+性能调优)

3-5年资深:

  • 数据库(调优+事务+锁+集群+主从+缓存等)
  • Linux(命令+生产环境+日志等)
  • 中间件&分布式 (dubbo+MQ/kafka、ElasticSearch、SpringCloud等组件)

5-7年架构:

  • 开源框架 (Spring5源码+SpringMVC源码+Mybatis源码)
  • 分布式架构 (Zk实战+RabbitMQ+RocketMQ+Kafka)
  • 高效存储 (Redis+mongoDB+MySQL高可用+Mycat+Sharing-Sphere)
  • 微服务架构(RPC+SpringBoot+SpringCloud+Netflix+SpringCloudAlibaba+docker+k8s)

注:含答案 ! 篇幅有限,已整理到网盘 ,添加助理微信,免费获取。

如果你觉得这些内容对你有帮助,可以加入csdn进阶交流群:714827309,领取资料

基础篇


JVM 篇



由于篇幅限制,详解资料太全面,细节内容太多,所以只把部分知识点截图出来粗略的介绍,每个小节点里面都有更细化的内容!

如果你觉得这些内容对你有帮助,可以加入csdn进阶交流群:714827309,领取资料

MySQL 篇



Redis 篇




由于篇幅限制,详解资料太全面,细节内容太多,所以只把部分知识点截图出来粗略的介绍,每个小节点里面都有更细化的内容!

如果你觉得这些内容对你有帮助,可以加入csdn进阶交流群:714827309,领取资料

以上是关于面试官:数据库自增 ID 用完了会咋样?的主要内容,如果未能解决你的问题,请参考以下文章

面试官:你来说说,数据库自增 ID 用完了会咋样?

面试官问:MySQL的自增 ID 用完了,怎么办?

面试官问:MySQL 的自增 ID 用完了,怎么办?

杂谈自增主键用完了怎么办

InnoDB的自增键和row_id用完了会发生什么?

面试官竟然问我订单ID是怎么生成的?难道不是MySQL自增主键?