i++导致的CPU核心罢工,刚利用原子操作解决了,没想到缓存又出问题了

Posted king哥Java架构

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了i++导致的CPU核心罢工,刚利用原子操作解决了,没想到缓存又出问题了相关的知识,希望对你有一定的参考价值。

前言回顾

和小黑闲谈间,我们车间的老K突然出现在了门口。

“阿Q原来你在这里,让我好找,赶快回去吧,隔壁二号车间的虎子说我们改了他们的数据,上门来闹事了······”

i++引发的问题

“阿Q赶快回去吧,隔壁二号车间的虎子说我们改了他们的数据,上门来闹事了”

由于老K的突然出现,我不得不提前结束与小黑的交流,赶回了CPU一号车间。

见到我回来,虎子立刻朝我嚷嚷:“你们是怎么回事?才几纳秒的时间,就把数据给我改了,你说这事怎么办吧!”

我听着迷迷糊糊的,连连说到:“虎子你先别急,我刚回来,到底出什么事儿了,先让我了解清楚好不好?”

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

接下来,老K把事情的经过告诉了我。原来,我们两个CPU车间各自负责的线程都在执行一个i++的操作,我们都把i的值放到了自己的缓存中,完了之后都没有通知对方,加了两次但结果却只有一次,出现了数据不一致问题。

原子操作

了解清楚事情的原委之后,我向虎子说道:“大家都执行一样的代码,这事儿也不能怪我们啊”

虎子一听急了,“怎么不怪你们了,我们比你们先一步找内存拿走了i,那你们得等我们加完之后再用啊,不信你可以打电话问内存那家伙,看看是不是我们二号车间先来的”

如果你觉得自己学习效率低,缺乏正确的指导,可以加入资源丰富,学习氛围浓厚的技术圈一起学习交流吧!
[Java架构群]
群内有许多来自一线的技术大牛,也有在小厂或外包公司奋斗的码农,我们致力打造一个平等,高质量的JAVA交流圈子,不一定能短期就让每个人的技术突飞猛进,但从长远来说,眼光,格局,长远发展的方向才是最重要的。

“好好好,你先冷静一下,你看我们又不知道你们先去拿了,这不情有可原吗,再说现在事情已经出了,我们应该一起坐下来想个办法避免以后再次出现这种问题,你说是不是?”

虎子叹了口气问道:“那你说说你有什么办法?”

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

我继续说道:“你看啊,像咱们在执行i++这种操作的时候就不应该被干扰”

“不被干扰?”

“对,比如虎子你们二号车间在访问i的时候,我们一号车间就不能访问,需要等着,等你们访问完成我们再来,非常简单的办法却很有用”

虎子听完一愣,“这不就是加锁吗?你是想怪程序员做i++前没有加锁?”

“的确是加锁,不过这种简单操作还要程序员来加锁那也太麻烦了,咱们CPU内部处理好就行了”

“内部处理,你打算怎么实现?”,虎子问到。

“这,,让我想想···”,虎子问到了具体实现,我倒还没想到这一步。

这时,一旁的老K站了出来:“我倒是有个办法,可以找总线主任啊,他是负责协调各个车间使用系统总线访问内存的总指挥,让他在中间协调一下应该不难”

老K一语点醒梦中人,接着我们就去找了总线主任,后来我们商量出了一套解决方案:我们定义了一个叫原子操作的东西,表示这是一个不可切分的动作,谁要执行原子操作,总线主任就在系统总线上加上一个LOCK#信号,其他车间的想去访问内存就得等着,直到原子操作指令执行完毕。

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

我们把这套方案上报了领导,很快就批下来了,后面我们8个车间都按照这套方案来工作,以后程序员们把i++这样的动作换成原子操作后,问题就能迎刃而解。

不过施行了一段时间之后,各个车间却开始大倒苦水:就因为某个车间要执行一个原子操作,就让总线主任把系统总线锁住,其他车间的人都没法访问内存,都干不了活了,严重影响工作效率。

抱怨归抱怨,在没有更好的替代方案出现之前,日子还得过下去。

缓存引发的问题

不过,没过多久,数据不一致问题又一次出现了。

这一次,倒不是加法的问题,我们两车间还是因为各自缓存的原因,先后修改了变量的值,对方没有及时知道,误用了错误的值,以致酿成大错。

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

“阿Q,上次那办法好是好,可解决不了这一次的问题啊”,虎子再次找上门来。

“你来的正好,我正想去找你说这事呢”

“哦,是吗,难不成你想到解决之道了?”

“只是一些初步的想法,问题的核心在于现在咱们各个车间各自为政,都有自己的私有缓存,各自修改数据后向内存更新时也不互相打招呼,缺少一个联络机制”

虎子点了点头,“确实,所以咱们需要建立一个联络机制,来对各个车间的缓存内容进行统一管理是吗?”

“对!这事儿咱俩说了可不算,我建议召集8个核心车间的代表,统一开一个会议,详细讨论下这个问题。哦,对了,把总线主任也叫上,他经验丰富说不定能提供一些思路”

缓存一致性协议MESI

很快,咱们CPU的8个核心车间就为此问题召开了会议,并且取得了非常重要的成果。

我们牵了一条新的专线,把8个核心车间连接起来,用于各个车间之间进行信息沟通,不同于CPU外部的总线系统,大家把这个叫片内总线。

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

新的线路铺设好了,以后大家就可以通过这条线路即时沟通,为了解决之前出现的问题,大家还制定了一套规则,叫做缓存一致性协议。

规则里面规定了所有车间的缓存单元——缓存行有四种状态:

  • 已修改Modified (M)

缓存行已经被修改了,与内存的值不一样。如果别的CPU内核要读内存这块数据,要赶在这之前把该缓存行回写到主存,把状态变为共享(S).

  • 独占Exclusive (E)

缓存行只在当前CPU核心缓存中,而且和内存中数据一样。当别的CPU核心读取它时,状态变为共享;如果当前CPU核心修改了它,就要变为已修改状态。

  • 共享Shared (S)

缓存行存在于多个CPU核心的缓存中,而且和内存中的内容一致。

  • 无效Invalid (I)

缓存行是无效的

四种状态之间的转换是这样的:

i++导致的CPU罢工,刚利用原子操作解决了,没想到缓存又出问题了

按照这套规则,大家不能再像以前那样随意了,各车间对自家缓存进行读写时,都要相互通一下气,避免使用过时的数据。

除此之外,还规定如果一块内存区域被多个车间都缓存,就不再允许多个车间同时去修改缓存了。

会议还有另外一个收获,以前被各车间诟病的每次原子操作都要锁定总线,导致大家需要访问内存的都只能干等着的问题也得到了解决。以后总线主任不再需要锁定总线了,通过这次的缓存一致性协议就可以办到。

自此以后,数据不一致的问题总算是根治了,8个车间又开始愉快的工作了。

最后

给大家分享一篇一线开发大牛整理的java高并发核心编程神仙文档,里面主要包含的知识点有:多线程、线程池、内置锁、JMM、CAS、JUC、高并发设计模式、Java异步回调、CompletableFuture类等。

文档地址:一篇神文就把java多线程,锁,JMM,JUC和高并发设计模式讲明白了

码字不易,如果觉得本篇文章对你有用的话,请给我一键三连!关注作者,后续会有更多的干货分享,请持续关注!

以上是关于i++导致的CPU核心罢工,刚利用原子操作解决了,没想到缓存又出问题了的主要内容,如果未能解决你的问题,请参考以下文章

Java并发基础并发编程bug源头:可见性原子性和有序性

多线程程序,当一条原子指令刚执行一半的时候,CPU时间片耗尽,此时是立刻切换线程吗?

单核,多核CPU的原子操作

中断处理 I/O内存

java 多线程 cpu利用率100%问题,我做了一个程序,10个线程,不到一分钟,cpu就100%了,怎么解决。

电脑的CPU利用率达到100%是怎么回事?