分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片
Posted 爱可生开源社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片相关的知识,希望对你有一定的参考价值。
关于作者
钟 悦 - 资深DBLE用户
某宇宙行资深架构师,在大型重点项目中使用 DBLE。
常年与 mysql 纠缠不清,经常运用技术处理大企业病的技术or非技术问题的一个挨踢从业者。
这是先求模得到逻辑分片号,再根据逻辑分片号直接映射到物理分片的一种散列算法。
1. 用户需要在 rule.xml 中定义 partitionLength[] 和 partitionCount[] 两个数组
2. 在 DBLE 的启动阶段,点乘这两个数组得到模数,也是逻辑分片的数量
3. 并且根据两个数组的叉乘,得到各个逻辑分片到物理分片的映射表(物理分片数量是 partitionCount[] 数组的元素值之和)
4. 在 DBLE 的运行过程中,用户访问使用这个算法的表时,WHERE 子句中的分片索引值会被提取出来进行求模,得到逻辑分片号
5. 再根据逻辑分片号,查映射表,直接得到物理分片号
与MyCat的类似分片算法对比
artitionLength为1,partitionCount为N,就是按照N取模的拆分算法
partitionLength 与 partitionCount 点乘值在 [1,2880] 之间
开发注意点
【分片索引】1. 必须是整型数字或整型数字的字符串(可以为负数)
【分片索引】2. 最大物理分片配置方法是,让 partitionCount 数组的和等于2880
例如:
<property name="partitionLength">1</property>
<property name="partitionCount">2880</property>
或:
<property name="partitionLength">1,1</property>
<property name="partitionCount">1440,1440</property>
【分片索引】3. 最小物理分片配置方法是,让 partitionCount 数组的和等于1
例如:
<property name="partitionLength">2880</property>
<property name="partitionCount">1</property>
【分片索引】4. partitionLength 和 partitionCount 被当做两个逗号分隔的一 维数组,它们之间的点乘必须在 [1, 2880] 范围内
【分片索引】5. partitionLength 和 partitionCount 的配置对顺序敏感
<property name="partitionLength">512,256</property>
<property name="partitionCount">1,2</property>
和
<property name="partitionLength">256,512</property>
<property name="partitionCount">2,1</property>”
是不同的分片结果
【数据分布】1. 与分片索引值相关而与 INSERT 先后无相关性,所以在直接使用时无法保证数据分布均匀,但如果分片索引本身连续递增(交易流水号等),则可以期待数据分布较为平均,但副作用会导致范围语句变成跨分片查询
例如:
SELECT ... WHERE shard_key BETWEEN 1 AND 100
运维注意点
【扩容】1. 预先过量分片,并且不改变 partitionCount 和 partitionLength 点乘结果,可以避免数据再平衡,只需进行涉及数据的迁移
【扩容】2. 若需要改变 partitionCount 和 partitionLength 点乘结果,需要数据再平衡
【缩容】1. 预先过量分片,并且不改变partitionCount和partitionLength点乘结果,可以避免数据再平衡,只需进行涉及数据的迁移
【缩容】2. 若需要改变 partitionCount 和 partitionLength 点乘结果,需要数据再平衡
配置注意点
【配置项】1. 在rule.xml中,可配置项为 <property name="partitionLength"> 和 <property name="partitionCount">
内容形式为:<物理分片持有的虚拟分片数>[,<物理分片持有的虚拟分片数>,...<物理分片持有的虚拟分片数>]
物理分片持有的虚拟分片数必须是整型,物理分片持有的虚拟分片数从左到右与同顺序的物理分片数对应,partitionLength 和partitionCount 的点乘结果必须在 [1, 2880] 范围内
【配置项】3.在rule.xml中配置 <propertyname="partitionCount">
内容形式为:<物理分片数>[,<物理分片数>,...<物理分片数>]
其中物理分片数必须是整型,物理分片数按从左到右的顺序,与同顺序的物理分片持有的虚拟分片数对应。物理分片的编号从左到右连续递进,partitionLength 和 partitionCount 的点乘结果必须在 [1, 2880] 范围内
【配置项】4.partitionLength 和 partitionCount 的语义是:持有partitionLength[i] 个虚拟分片的物理分片有 partitionCount[i] 个
例如:
<property name="partitionLength">512,256</property>
<property name="partitionCount">1,2</property>
语义是持有 512个 逻辑分片的物理分片有 1 个,紧随其后,持有 256 个逻辑分片的物理分片有 2 个。
【配置项】5. partitionLength 和 partitionCount 都对书写顺序敏感
例如:
<property name="partitionLength">512,256</property>
<property name="partitionCount">1,2</property>
分片结果是第一个物理分片持有头 512 个逻辑分片,第二个物理分片持有紧接着的 256 个逻辑分片,第三个物理分片持有最后 256 个逻辑分片,相对的
<property name="partitionLength">256,512</property>
<property name="partitionCount">2,1</property>
分片结果则是第一个物理分片持有头 256 个逻辑分片,第二个物理分片持有紧接着的 256 个逻辑分片,第三个物理分片持有最后 512 个逻辑分片。
【配置项】6. partitionLength[] 的元素全部为 1 时,这时候 partitionCount 数组和等于 partitionLength 和 partitionCount 的点乘,物理分片和逻辑分片就会一一对应,该分片算法等效于直接取余。
近期社区动态
以上是关于分布式 | MyCat如何迁移到DBLE之分片算法对比解析:hash分片的主要内容,如果未能解决你的问题,请参考以下文章 本周四直播预告:MyCat的坑如何在分布式中间件DBLE上改善 技术分享 | MyCat的坑如何在分布式中间件DBLE上改善(内含视频链接)