mysql5.6.20如何开启分区功能

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql5.6.20如何开启分区功能相关的知识,希望对你有一定的参考价值。

mysql 5.5的发布带来了许多增强的功能,虽然已经报道了很多增强功能,如半同步复制,但大家却忽略了分区方面的增强,有时甚至还对其真正意义产生了误解,在这篇文章中,我们希望解释一下这些很酷的增强,特别是我们大多数人还没有完全理解的地方。51CTO向您推荐《MySQL数据库入门与精通教程》。

非整数列分区

任何使用过分区的人应该都遇到过不少问题,特别是面对非整数列分区时,MySQL 5.1只能处理整数列分区,如果你想在日期或字符串列上进行分区,你不得不使用函数对其进行转换。

MySQL 5.5中新增了两类分区方法,RANG和LIST分区法,同时在新的函数中增加了一个COLUMNS关键词。我们假设有这样一个表:

1.  CREATE TABLE expenses (  

2.    expense_date DATE NOT NULL,  

3.    category VARCHAR(30),  

4.    amount DECIMAL (10,3)  

5.  ); 

如果你想使用MySQL 5.1中的分区类型,那你必须将类型转换成整数,需要使用一个额外的查找表,到了MySQL 5.5中,你可以不用再进行类型转换了,如:

1.  ALTER TABLE expenses  

2.  PARTITION BY LIST COLUMNS (category)  

3.  (  

4.    PARTITION p01 VALUES IN ( \'lodging\', \'food\'),  

5.    PARTITION p02 VALUES IN ( \'flights\', \'ground transportation\'),  

6.    PARTITION p03 VALUES IN ( \'leisure\', \'customer entertainment\'),  

7.    PARTITION p04 VALUES IN ( \'communications\'),  

8.    PARTITION p05 VALUES IN ( \'fees\')  

9.  ); 

这样的分区语句除了更加易读外,对数据的组织和管理也非常清晰,上面的例子只对category列进行分区。

在MySQL 5.1中使用分区另一个让人头痛的问题是date类型(即日期列),你不能直接使用它们,必须使用YEAR或TO_DAYS转换这些列,如:

1.  /* 在MySQL 5.1中*/  

2.  CREATE TABLE t2  

3.  (  

4.    dt DATE 

5.  )  

6.  PARTITION BY RANGE (TO_DAYS(dt))  

7.  (  

8.    PARTITION p01 VALUES LESS THAN (TO_DAYS(\'2007-01-01\')),  

9.    PARTITION p02 VALUES LESS THAN (TO_DAYS(\'2008-01-01\')),  

10.   PARTITION p03 VALUES LESS THAN (TO_DAYS(\'2009-01-01\')),  

11.   PARTITION p04 VALUES LESS THAN (MAXVALUE));  

12.  

13. SHOW CREATE TABLE t2 \\G  

14. *************************** 1. row ***************************  

15.        Table: t2  

16. Create Table: CREATE TABLE `t2` (  

17.   `dt` date DEFAULT NULL 

18. ) ENGINE=MyISAM DEFAULT CHARSET=latin1  

19. /*!50100 PARTITION BY RANGE (TO_DAYS(dt))  

20. (PARTITION p01 VALUES LESS THAN (733042) ENGINE = MyISAM,  

21.  PARTITION p02 VALUES LESS THAN (733407) ENGINE = MyISAM,  

22.  PARTITION p03 VALUES LESS THAN (733773) ENGINE = MyISAM,  

23.  PARTITION p04 VALUES LESS THAN MAXVALUE ENGINE = MyISAM) */ 

看上去非常糟糕,当然也有变通办法,但麻烦确实不少。使用YEAR或TO_DAYS定义一个分区的确让人费解,查询时不得不使用赤裸列,因为加了函数的查询不能识别分区。

但在MySQL 5.5中情况发生了很大的变化,现在在日期列上可以直接分区,并且方法也很简单。

1.  /*在MySQL 5.5中*/  

2.  CREATE TABLE t2  

3.  (  

4.    dt DATE 

5.  )  

6.  PARTITION BY RANGE COLUMNS (dt)  

7.  (  

8.    PARTITION p01 VALUES LESS THAN (\'2007-01-01\'),  

9.    PARTITION p02 VALUES LESS THAN (\'2008-01-01\'),  

10.   PARTITION p03 VALUES LESS THAN (\'2009-01-01\'),  

11.   PARTITION p04 VALUES LESS THAN (MAXVALUE));  

12.  

13. SHOW CREATE TABLE t2 \\G  

14. *************************** 1. row ***************************  

15.        Table: t2  

16. Create Table: CREATE TABLE `t2` (  

17.   `dt` date DEFAULT NULL 

18. ) ENGINE=MyISAM DEFAULT CHARSET=latin1  

19. /*!50500 PARTITION BY RANGE  COLUMNS(dt)  

20. (PARTITION p01 VALUES LESS THAN (\'2007-01-01\') ENGINE = MyISAM,  

21.  PARTITION p02 VALUES LESS THAN (\'2008-01-01\') ENGINE = MyISAM,  

22.  PARTITION p03 VALUES LESS THAN (\'2009-01-01\') ENGINE = MyISAM,  

23.  PARTITION p04 VALUES LESS THAN (MAXVALUE) ENGINE = MyISAM) */ 

在这里,通过函数定义和通过列查询之间没有冲突,因为是按列定义的,我们在定义中插入的值是保留的。

多列分区

COLUMNS关键字现在允许字符串和日期列作为分区定义列,同时还允许使用多个列定义一个分区,你可能在官方文档中已经看到了一些例子,如: 

1.  CREATE TABLE p1 (  

2.    a INT,  

3.    b INT,  

4.    c INT 

5.  )  

6.  PARTITION BY RANGE COLUMNS (a,b)  

7.  (  

8.    PARTITION p01 VALUES LESS THAN (10,20),  

9.    PARTITION p02 VALUES LESS THAN (20,30),  

10.   PARTITION p03 VALUES LESS THAN (30,40),  

11.   PARTITION p04 VALUES LESS THAN (40,MAXVALUE),  

12.   PARTITION p05 VALUES LESS THAN (MAXVALUE,MAXVALUE)  

13. );  

14.  

15. CREATE TABLE p2 (  

16.   a INT,  

17.   b INT,  

18.   c INT 

19. )  

20. PARTITION BY RANGE COLUMNS (a,b)  

21. (  

22.   PARTITION p01 VALUES LESS THAN (10,10),  

23.   PARTITION p02 VALUES LESS THAN (10,20),  

24.   PARTITION p03 VALUES LESS THAN (10,30),  

25.   PARTITION p04 VALUES LESS THAN (10,MAXVALUE),  

26.   PARTITION p05 VALUES LESS THAN (MAXVALUE,MAXVALUE)  

27. ) 

同样还有PARTITION BY RANGE COLUMNS (a,b,c)等其它例子。由于我很长时间都在使用MySQL 5.1的分区,我对多列分区的含义不太了解,LESS THAN (10,10)是什么意思?如果下一个分区是LESS THAN (10,20)会发生什么?相反,如果是(20,30)又会如何?

所有这些问题都需要一个答案,在回答之前,他们需要更好地理解我们在做什么。

开始时可能有些混乱,当所有分区有一个不同范围的值时,实际上,它只是在表的一个列上进行了分区,但事实并非如此,在下面的例子中:

1.  CREATE TABLE p1_single (  

2.    a INT,  

3.    b INT,  

4.    c INT 

5.  )  

6.  PARTITION BY RANGE COLUMNS (a)  

7.  (  

8.    PARTITION p01 VALUES LESS THAN (10),  

9.    PARTITION p02 VALUES LESS THAN (20),  

10.   PARTITION p03 VALUES LESS THAN (30),  

11.   PARTITION p04 VALUES LESS THAN (40),  

12.   PARTITION p05 VALUES LESS THAN (MAXVALUE)  

13. ); 

它和前面的表p1不一样,如果你在表p1中插入(10,1,1),它将会进入第一个分区,相反,在表p1_single中,它将会进入第二个分区,其原因是(10,1)小于(10,10),如果你仅仅关注第一个值,你还没有意识到你在比较一个元组,而不是一个单一的值。

现在我们来分析一下最难懂的地方,当你需要确定某一行应该放在哪里时会发生什么?你是如何确定类似(10,9) < (10,10)这种运算的值的?答案其实很简单,当你对它们进行排序时,使用相同的方法计算两条记录的值。

1.  a=10  

2.  b=9  

3.  (a,b) < (10,10) ?  

4.   

5.  # evaluates to:  

6.   

7.  (a < 10)  

8.  OR 

9.  ((a = 10) AND ( b < 10))  

10.  

11. # which translates to:  

12.  

13. (10 < 10)  

14. OR 

15. ((10 = 10) AND ( 9 < 10)) 

如果有三列,表达式会更长,但不会更复杂。你首先在第一个项目上测试小于运算,如果有两个或更多的分区与之匹配,接着就测试第二个项目,如果不止一个候选分区,那还需要测试第三个项目。

下图所显示的内容表示将遍历三条记录插入到使用以下代码定义的分区中:

(10,10),

(10,20),

(10,30),

(10, MAXVALUE)

 

 
图 2 元组比较。当第一个值小于分区定义的第一个范围时,那么该行将属于这里了。

 

 
图 3 元组比较。当第一个值等于分区定义的第一个范围,我们需要比较第二个项目,如果它小于第二个范围,那么该行将属于这里了。

 

 
图 4 元组比较。当第一个值和第二个值等于他们对应的范围时,如果元组不小于定义的范围,那么它就不属于这里,继续下一步。

 

 
图 5 元组比较。在下一个范围时,第一个项目是等于,第二个项目是小于,因此元组更小,那么该行就属于这里了。

在这些图的帮助下,我们对插入一条记录到多列分区表的步骤有了更深的了解,这些都是理论上的,为了帮助你更好地掌握新功能,我们再来看一个更高级一点的例子,对于比较务实的读者更有意义,下面是表的定义脚本:

1.  CREATE TABLE employees (  

2.    emp_no int(11) NOT NULL,  

3.    birth_date date NOT NULL,  

4.    first_name varchar(14) NOT NULL,  

5.    last_name varchar(16) NOT NULL,  

6.    gender char(1) DEFAULT NULL,  

7.    hire_date date NOT NULL 

8.  ) ENGINE=MyISAM  

9.  PARTITION BY RANGE  COLUMNS(gender,hire_date)  

10. (PARTITION p01 VALUES LESS THAN (\'F\',\'1990-01-01\') ,  

11.  PARTITION p02 VALUES LESS THAN (\'F\',\'2000-01-01\') ,  

12.  PARTITION p03 VALUES LESS THAN (\'F\',MAXVALUE) ,  

13.  PARTITION p04 VALUES LESS THAN (\'M\',\'1990-01-01\') ,  

14.  PARTITION p05 VALUES LESS THAN (\'M\',\'2000-01-01\') ,  

15.  PARTITION p06 VALUES LESS THAN (\'M\',MAXVALUE) ,  

16.  PARTITION p07 VALUES LESS THAN (MAXVALUE,MAXVALUE) 

和上面的例子不同,这个例子更好理解,第一个分区用来存储雇佣于1990年以前的女职员,第二个分区存储股用于1990-2000年之间的女职员,第三个分区存储所有剩下的女职员。对于分区p04到p06,我们策略是一样的,只不过存储的是男职员。最后一个分区是控制情况。

看完后你可能要问,我怎么知道某一行存储在那个分区中的?有两个办法,第一个办法是使用与分区定义相同的条件作为查询条件进行查询。
参考技术A 8# MMH88288@QQ.COM 童鞋,你给的链接应该是把软件装在SD卡上的吧??这个貌似跟swap分区是不一样的````

MySQL表分区优势及分类简析 MySQL DBA学习

表分区是将一个表的数据按照一定规则水平划分不同的逻辑块,并分别进行物理存储,这个规则就叫做分区函数可以有不同的分区规则通过show plugins语句查看当前MySQL是否支持表分区功能MySQL5.7社区版本的表分区功能是默认开启的但当表中含有主键或唯一键时,则每个被用作分区函数的字段必须是表中唯一键和主键的全部或一部分,否则就无法创建分区表 

 

表分区的主要优势是:

1.可以在一个表里存储更多的数据,突破磁盘限制或者文件系统限制

2.对于从表里将过期或历史数据移除在表分区很容易实现,只要将对应的分区移除即可 

3.对某些查询和修改语句来说,可自动将数据范围缩小到一个或几个表分区上,优化语句执行效率;还可通过显示指定表分区来执行语句

 

表分区类型有:

1.RANGE表分区:范围表分区,按照一定的范围值来确定每个分区包含的数据 

2.LIST表分区:列表表分区,按照一个一个确定的值来确定每个分区包含的数据 

3.HASH表分区:哈希表分区,按照一个自定义的函数返回值来确定每个分区包含的数据 

4.KEY表分区 :key表分区,与哈希表分区类似,只是用MySQL自己的HASH函数来确定每个分区包含的数据

互联网企业大多用的数据库是MySQL的,想要众多的IT工作者中脱颖而出,就需要拥有高深的技术,学习增值是必不可少的。学习之路,是贵在坚持的。老男孩教育MySQL DBA课程,几经更新课程,杜绝纸上谈兵,全企业真实案例结合理论授课,想深入的学习MySQL DBA的知识,可以关注下老男孩教育。


以上是关于mysql5.6.20如何开启分区功能的主要内容,如果未能解决你的问题,请参考以下文章

单机服务器已经安装好二进制mysql5.6.20,然后开启mysql多实例

mysql5.6.20二进制安装部署文档

mysql5.6.20二进制安装

mysql5.6.20数据库sql_mode模式设置

MySQL5.6参数binlog-do-db和log-slave-updates跨库同步注意事项

关于Centos7和Centos6中新分区如何开启acl功能