mycat读写分离+垂直切分+水平切分+er分片+全局表测试

Posted 2020-10-07 疯狂110

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了mycat读写分离+垂直切分+水平切分+er分片+全局表测试相关的知识，希望对你有一定的参考价值。

原文http://blog.163.com/[email protected]/blog/static/172718064201683031639683/

读写分离：利用最基础的mysql主从复制，事务性的查询无法分离出去（因为会导致数据不一致），这样就无法做到真正的读写分离，因为有些场景可能大部分都是事物性的读。解决方法： galera for mysql 强一致性。

http://www.blogjava.net/amigoxie/archive/2014/12/24/421788.html

http://blog.csdn.net/benluobobo/article/details/51099607

http://blog.csdn.net/wulex/article/details/52495488

好的实例连接：http://blog.csdn.net/wulex/article/details/52495488

安装使用过程遇到的问题：

1、mycat启动后报错，进程直接退出： Error: Exception thrown by the agent : java.net.MalformedURLException: Local host name unknown: java.net.UnknownHostException: ys-fs: ys-fs: Name or service not known

原因：本机要配置/etc/hosts 127.0.0.1 主机名

一、垂直切分测试：

1、schema.xml里面加入：

<dataHost name="host0" maxCon="1000" minCon="10" balance="0"

writeType="0" dbType="mysql" dbDriver="native">

<heartbeat>select user()</heartbeat>

</dataHost>

<dataHost name="host1" maxCon="1000" minCon="10" balance="0"

writeType="0" dbType="mysql" dbDriver="native">

<heartbeat>select user()</heartbeat>

</dataHost>

<dataHost name="host2" maxCon="1000" minCon="10" balance="0"

writeType="0" dbType="mysql" dbDriver="native">

<heartbeat>select user()</heartbeat>

</dataHost>

2、server.xml加入：

<property name="schemas">weixin,yixin,sms</property>

</user>

3、遇到问题：

1)、Caused by: org.xml.sax.SAXParseException; lineNumber: 106; columnNumber: 16; The content of element type "mycat:schema" must match "(schema*,dataNode*,dataHost*)".

原因：要按照schema、datanode 、datahost的顺序放，不能打乱。也就是所有schema要放一起，然后接着才能放datanode。。。。

2)、报1184错误，是因为没有把datahost主机的权限授予mycat所在主机。

这里的用户要授予mycat所在主机远程访问权限：

GRANT ALL PRIVILEGES ON *.* TO ‘root‘@‘%‘ IDENTIFIED BY ‘youngsun‘

二、水平切分测试：

1、分别建立4个库：user0、user1、user2、user3。我这里4个库建在4个独立的主机上。

CREATE DATABASE user0 DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

2、创建表结构

在user0～user2创建同样的表结构，t_user和t_user_class_rel的建表语句参考如下：

DROP TABLE IF EXISTS `t_user_ext`;
技术分享

CREATE TABLE `t_user_ext` (
技术分享

`user_id` int(11) NOT NULL COMMENT ‘用户ID‘,
技术分享

`receive_address` varchar(256) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT ‘收货地址‘,
技术分享

`create_time` datetime NOT NULL,
技术分享

`province_code` varchar(10) COLLATE utf8_unicode_ci DEFAULT NULL,
技术分享

PRIMARY KEY (`user_id`)
技术分享

) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci COMMENT=‘用户信息表‘;
技术分享

DROP TABLE IF EXISTS `t_user_class_rel`;
技术分享

CREATE TABLE `t_user_class_rel` (
技术分享

`id` int(11) NOT NULL AUTO_INCREMENT COMMENT ‘id‘,
技术分享

`caller` varchar(16) CHARACTER SET utf8 NOT NULL COMMENT ‘调用方系统表示‘,
技术分享

`province_code` varchar(10) CHARACTER SET utf8 DEFAULT NULL COMMENT ‘省份编码‘,
技术分享

`user_id` int(11) NOT NULL COMMENT ‘用户ID‘,
技术分享

`class_id` int(11) NOT NULL COMMENT ‘班级ID‘,
技术分享

`role_type` int(11) DEFAULT NULL COMMENT ‘用户在该班的角色（1学生2家长3教师）‘,
技术分享

`create_time` datetime NOT NULL COMMENT ‘创建时间‘,
技术分享

`modify_time` datetime DEFAULT NULL COMMENT ‘修改时间‘,
技术分享

PRIMARY KEY (`id`),
技术分享

UNIQUE KEY `idx_rel_user_class_id` (`user_id`,`class_id`,`role_type`),
技术分享

KEY `idx_rel_user_id` (`user_id`) USING BTREE,
技术分享

KEY `idx_rel_class_id` (`class_id`)
技术分享

) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

3、添加schema：加了一点内容：不分表的情况测试（只对部分表进行切分。其实这种时候，没有切分的表，应该是不需要跟已经切分过的表进行关联，否则就会垮库join。既然是这样，那业务就比较独立了，为什么不把这部分表垂直切分出去呢？）总结心得：1、如果某张表进行水平切分了，那么跟他有事物关联的表，要么搞全局表，要么进行er分片，不然就会导致垮库join。而没有关联关系的表或者非事物关联的表，实际上可以垂直切分出去（如果有必要）。2、dataHost可以理解成一个主机组，可以是单机，可以是主从，可以是galera 等搭建起来的集群。读写分离就是在这里处理的。ha、读写分离等都在这里进行配置，都是针对datahost。

技术分享        
       <table name="t_user" dataNode="user0,user1,user2,user3" rule="rule_wyh">
           <childTable name="t_user_class_rel" primaryKey="id" joinKey="user_id" parentKey="user_id" />
       </table>

<table name="t_user_1" dataNode="user3" >
技术分享

</table>
</schema>

4、添加datahost：host3

<dataHost name="host3" maxCon="1000" minCon="10" balance="0"

writeType="0" dbType="mysql" dbDriver="native">

<heartbeat>select user()</heartbeat>

</dataHost>

在238上授权授权：

GRANT ALL PRIVILEGES ON *.* TO ‘root‘@‘%‘ IDENTIFIED BY ‘youngsun‘;

flush privileges;

5、配置rule.xml文件

在schema.xml的文件内容中可看到t_user表指定的分片规则是rule1，需要在conf/rule.xml文件中设置rule1的规则为根据user_id进行分片，并按照类“org.opencloudb.route.function.PartitionByLong”的规则进行分片，即将user_id模除1024后每256内分到一个数据库中，即模除后0～255到user0数据库库，256～511到user1数据库，512～767到user2数据库，768～1023到user3数据库。

总结心得：普通取模算法，连续的id会路由到不同的分片。增大了批量插入的事务控制难度，而固定分片hash算法根据二进制则可能会分到连续的分片，减少插入事务事务控制难度。

该文件的参考内容如下所示：

<?xml version="1.0" encoding="UTF-8"?>
技术分享

<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
技术分享

<mycat:rule xmlns:mycat="http://org.opencloudb/">
技术分享

<tableRule name="rule_wyh">
技术分享

<rule>

<columns>user_id</columns>
技术分享

<algorithm>func_4p</algorithm>
技术分享

</rule>

</tableRule>
技术分享

<function name="func_4p" class="org.opencloudb.route.function.PartitionByLong">
技术分享

<property name="partitionCount">4</property>
技术分享

<property name="partitionLength">256</property>
技术分享

</function>
技术分享

</mycat:rule>

6、配置server.xml文件

在server.xml文件中的schemas属性中添加test_sharding的schema。修改后的文件如下所示：

<!DOCTYPE mycat:server SYSTEM "server.dtd">
技术分享

<mycat:server xmlns:mycat="http://org.opencloudb/">
技术分享

<property name="sequnceHandlerType">0</property>
技术分享

</system>

<user name="test">
技术分享

<property name="password">test</property>
技术分享

<property name="schemas">weixin,yixin,photo,test_sharding</property>
技术分享

</user>

</mycat:server>

7、水平切分测试

重启MyCAT，使用MySQL客户端连接后，连接后可在test_sharding数据库下看到t_user和t_user_class_rel表，

在MySQL客户端连接的MyCat的test_sharding数据库的t_user表运行如下技术分享插入语句，插入user_id=1、255、256、511、512、1023、1024、50、300、1000的数据：注意insert into 必须带上字段名列表，不然报错插不进去。

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘1‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘255‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘256‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘511‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘512‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘1023‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘1024‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘50‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘300‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);

INSERT INTO t_user( user_id , receive_address , create_time , province_code ) VALUES(‘1000‘, ‘广州市越秀区广州大道中599号‘, ‘2014-07-17 10:53:15‘, ‘GD‘);
技术分享

而后在MyCAT的test_sharding数据库的t_user表运行select查看记录执行情况。进入localhost的user0～user3数据库，查看数据是否按照之前确定的rule1的规则写入不同的数据库。

读者可在test_sharding数据库的t_user表执行update和delete等语句，并去分库查看执行结果，可得知MyCAT对MySQL客户端基本透明，对程序也几乎透明，在select语句运行时，MyCAT会自行去各个分库按照规则获取合并结果。

接着测试按照ER关系策略分片的t_user_class_rel表是否按照user_id的分片策略，同样user_id的数据分布在同一个user库的t_user表和t_user_class_rel表。

在MyCAT的test_mycat数据库的t_user_class_rel表运行如下语句：

INSERT INTO `t_user_class_rel`( `id` , `caller` , `province_code` , `user_id` , `class_id` , `role_type` , `create_time` , `modify_time`) VALUES (‘257‘, ‘eip‘, ‘GD‘, ‘2‘, ‘35‘, ‘3‘, ‘2012-08-05 17:32:13‘, ‘2013-12-27 16:07:32‘);

INSERT INTO `t_user_class_rel`( `id` , `caller` , `province_code` , `user_id` , `class_id` , `role_type` , `create_time` , `modify_time`) VALUES (‘1‘, ‘eip‘, ‘GD‘, ‘257‘, ‘35‘, ‘3‘, ‘2012-08-05 17:32:13‘, ‘2013-12-27 16:07:32‘);

INSERT INTO `t_user_class_rel`( `id` , `caller` , `province_code` , `user_id` , `class_id` , `role_type` , `create_time` , `modify_time`) VALUES (‘2‘, ‘eip‘, ‘GD‘, ‘513‘, ‘35‘, ‘3‘, ‘2012-08-05 17:32:13‘, ‘2013-12-27 16:07:32‘);

INSERT INTO `t_user_class_rel`( `id` , `caller` , `province_code` , `user_id` , `class_id` , `role_type` , `create_time` , `modify_time`) VALUES (‘3‘, ‘eip‘, ‘GD‘, ‘769‘, ‘35‘, ‘3‘, ‘2012-08-05 17:32:13‘, ‘2013-12-27 16:07:32‘);

而后在MyCAT的test_mycat数据库的t_user_class_rel表运行select查看记录执行情况。进入localhost的user0～user3数据库，查看数据是否按照之前确定的rule1的规则和ER分片策略写入不同的数据库。

分片join解决方案心得小结：如果一张表做分片了，其他有一张表要跟这张表做关联，方案如下：

1、全局表（适合做的才做）：非跨分片join

2、另一张表也搞分片：非跨分片join

3、share join（只能2个表join）：跨分片join

4、另一张表里join用到的字段冗余到已经做了分片的那张表上去：不用join （该方案可用性不错）

5、另一张表里join用到的字段搞成一张全局表：非跨分片join

三、读写分离

MyCAT的读写分离机制如下：

事务内的SQL，全部走写节点，除非某个select语句以注释/*balance*/开头
自动提交的select语句会走读节点，并在所有可用读节点中间随机负载均衡
当某个主节点宕机，则其全部读节点都不再被使用，因为此时，同步失败，数据已经不是最新的，MyCAT会采用另外一个主节点所对应的全部读节点来实现select负载均衡。
当所有主节点都失败，则为了系统高可用性，自动提交的所有select语句仍将提交到全部存活的读节点上执行，此时系统的很多页面还是能出来数据，只是用户修改或提交会失败。

231和233主从配置，233配置成读库。

<dataHost name="host1" maxCon="1000" minCon="10" balance="1"

writeType="0" dbType="mysql" dbDriver="native">

<heartbeat>select user()</heartbeat>

</writeHost>

</dataHost>

以上是关于mycat读写分离+垂直切分+水平切分+er分片+全局表测试的主要内容，如果未能解决你的问题，请参考以下文章

mycat读写分离+垂直切分+水平切分+er分片+全局表 测试

mycat读写分离+垂直切分+水平切分+er分片+全局表测试