分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片

Posted 爱可生开源社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片相关的知识,希望对你有一定的参考价值。


关于作者

钟 悦  -  资深DBLE用户

某宇宙行资深架构师,在大型重点项目中使用 DBLE。

常年与 mysql 纠缠不清,经常运用技术处理大企业病的技术or非技术问题的一个挨踢从业者。


这是先求模得到逻辑分片号,再根据逻辑分片号直接映射到物理分片的一种散列算法。

1. 用户需要在 rule.xml 中定义 partitionLength[] 和 partitionCount[] 两个数组

2. 在 DBLE 的启动阶段,点乘这两个数组得到模数,也是逻辑分片的数量

3. 并且根据两个数组的叉乘,得到各个逻辑分片到物理分片的映射表(物理分片数量是 partitionCount[] 数组的元素值之和)

4. 在 DBLE 的运行过程中,用户访问使用这个算法的表时,WHERE 子句中的分片索引值会被提取出来进行求模,得到逻辑分片号

5. 再根据逻辑分片号,查映射表,直接得到物理分片号


与MyCat的类似分片算法对比

分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片

  • artitionLength为1,partitionCount为N,就是按照N取模的拆分算法

  • partitionLength 与 partitionCount 点乘值在 [1,2880] 之间


开发注意点

【分片索引】1. 必须是整型数字或整型数字的字符串(可以为负数)

【分片索引】2. 最大物理分片配置方法是,让 partitionCount 数组的和等于2880

例如:

 
   
   
 
  1. <property name="partitionLength">1</property>

  2. <property name="partitionCount">2880</property>

或:

 
   
   
 
  1. <property name="partitionLength">1,1</property>

  2. <property name="partitionCount">1440,1440</property>

【分片索引】3. 最小物理分片配置方法是,让 partitionCount 数组的和等于1

例如:

 
   
   
 
  1. <property name="partitionLength">2880</property>

  2. <property name="partitionCount">1</property>

【分片索引】4. partitionLength 和 partitionCount 被当做两个逗号分隔的一 维数组,它们之间的点乘必须在 [1, 2880] 范围内

【分片索引】5. partitionLength 和 partitionCount 的配置对顺序敏感

 
   
   
 
  1. <property name="partitionLength">512,256</property>

  2. <property name="partitionCount">1,2</property>

 
   
   
 
  1. <property name="partitionLength">256,512</property>

  2. <property name="partitionCount">2,1</property>

是不同的分片结果

【数据分布】1. 与分片索引值相关而与 INSERT 先后无相关性,所以在直接使用时无法保证数据分布均匀,但如果分片索引本身连续递增(交易流水号等),则可以期待数据分布较为平均,但副作用会导致范围语句变成跨分片查询

例如:

 
   
   
 
  1. SELECT ... WHERE shard_key BETWEEN 1 AND 100


运维注意点

【扩容】1. 预先过量分片,并且不改变 partitionCount 和 partitionLength 点乘结果,可以避免数据再平衡,只需进行涉及数据的迁移

【扩容】2. 若需要改变 partitionCount 和 partitionLength 点乘结果,需要数据再平衡

【缩容】1. 预先过量分片,并且不改变partitionCount和partitionLength点乘结果,可以避免数据再平衡,只需进行涉及数据的迁移

【缩容】2. 若需要改变 partitionCount 和 partitionLength 点乘结果,需要数据再平衡


配置注意点

【配置项】1. 在rule.xml中,可配置项为 <property name="partitionLength">  <property name="partitionCount"> 

【配置项】2. 在 rule.xml 中配置  <propertyname="partitionLength">  标签

内容形式为:<物理分片持有的虚拟分片数>[,<物理分片持有的虚拟分片数>,...<物理分片持有的虚拟分片数>]

物理分片持有的虚拟分片数必须是整型,物理分片持有的虚拟分片数从左到右与同顺序的物理分片数对应,partitionLength 和partitionCount 的点乘结果必须在 [1, 2880] 范围内

【配置项】3.在rule.xml中配置 <propertyname="partitionCount">  标签

内容形式为:<物理分片数>[,<物理分片数>,...<物理分片数>]

其中物理分片数必须是整型,物理分片数按从左到右的顺序,与同顺序的物理分片持有的虚拟分片数对应。物理分片的编号从左到右连续递进,partitionLength 和 partitionCount 的点乘结果必须在 [1, 2880] 范围内

【配置项】4.partitionLength 和 partitionCount 的语义是:持有partitionLength[i] 个虚拟分片的物理分片有 partitionCount[i] 个

例如:

 
   
   
 
  1. <property name="partitionLength">512,256</property>

  2. <property name="partitionCount">1,2</property>

语义是持有 512个 逻辑分片的物理分片有 1 个,紧随其后,持有 256 个逻辑分片的物理分片有 2 个。

【配置项】5. partitionLength 和 partitionCount 都对书写顺序敏感

例如:

 
   
   
 
  1. <property name="partitionLength">512,256</property>

  2. <property name="partitionCount">1,2</property>

分片结果是第一个物理分片持有头 512 个逻辑分片,第二个物理分片持有紧接着的 256 个逻辑分片,第三个物理分片持有最后 256 个逻辑分片,相对的

 
   
   
 
  1. <property name="partitionLength">256,512</property>

  2. <property name="partitionCount">2,1</property>

分片结果则是第一个物理分片持有头 256 个逻辑分片,第二个物理分片持有紧接着的 256 个逻辑分片,第三个物理分片持有最后 512 个逻辑分片。

【配置项】6. partitionLength[] 的元素全部为 1 时,这时候 partitionCount 数组和等于 partitionLength 和 partitionCount 的点乘,物理分片和逻辑分片就会一一对应,该分片算法等效于直接取余。



分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片

近期社区动态


 

以上是关于分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片的主要内容,如果未能解决你的问题,请参考以下文章

如何解决mysql enum 类型字段的插入问题

本周四直播预告:MyCat的坑如何在分布式中间件DBLE上改善

技术分享 | MyCat的坑如何在分布式中间件DBLE上改善(内含视频链接)

重磅预告 | 今晚直播:MyCat的坑如何在分布式中间件DBLE上改善

DBLE解决了MyCAT的哪些坑?

深度分析 | MyCat与DBLE的对比性能调优