数据库类型空间效率探索

Posted 鴻飛

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库类型空间效率探索相关的知识,希望对你有一定的参考价值。

  • 测试环境

  • 表信息

表数据量22.23万,占用空间44.494M

  • 用到的sql语句

增加列:alter table t_type add column new_column char(1) default null;

修改列:alter table t_type modify new_column char(200) default null;

删除列:alter table t_tpye drop column new_column;

表占用空间:

select concat(round(sum(data_length/1024/1024),3),\'MB\') as data_size,
concat(round(sum(max_data_length/1024/1024),3),\'MB\') as max_data_length,
concat(round(sum(data_free/1024/1024),3),\'MB\') as data_free,
concat(round(sum(index_length/1024/1024),3),\'MB\') as index_length
from information_schema.tables where table_name=\'t_type\'

  • 测试结果

见如下表格:

占用空间 char(1) default null char(50) default null char(100) default null char(200) default null
data_size(MB) 45.123 44.922 44.922 44.922
index_length(MB) 2.256 2.256 2.256 2.256
data_free(MB) 0 0 0 0
 
占用空间 char(1) not null default \'\' char(50) not null default \'\' char(100) not null default \'\' char(200) not null default \'\'
data_size(MB) 44.922 44.721 44.721 44.721
index_length(MB) 2.256 2.256 2.256 2.256
data_free(MB) 0 0 0 0

 

向new_column char(200) not null default \'\'插入字符N个a\\啊
占用空间\\插入字符 1(a\\啊) 2(aa\\啊啊) 2(a啊/啊a) 3(aaa/啊哈呵) 35(a…a/啊…的/全半角混合)
data_size(MB) 45.729\\46.733 46.733\\48.961 48.961/48.961 48.961/48.961 63.377/66.617/67.617
index_length(MB) 2.256 2.256 2.256 2.256 2.256
data_free(MB) 0 0 0 0 4.24

 

这个时候,当插入35个字符时,产生了奇怪的现象,看下面截图

  • 重要步骤

可以看到,随着不断的更新字段中的数据,更新所耗费的时间逐渐增加(4.75->5.77->6.89->8.30),插入的最后一条数据(8.30sec),产生了4.240M的内存碎片。

优化表

优化后,表的大小明显减小,index_length也相应减小。

之前以为优化后的data_size为优化前的data_size减去data_free,看来不是这个样子。

通过上面的测试,对于char类型的字段,我得出了如下结论:

  • 结论:

1、对于char类型,char(1)占用的空间反而比char(50)占用的多。

2、char(N)随着N的增多,表占用的空间并没有增大,这样就和N多大就分配多大的说法相矛盾。所以下面斜体字说法是错误的:

char类型时定长的类型,即当定义的是char(10),输入的是"abc"这三个字符时,它们占的空间一样是10个字节,包括7个空字节。

3、在更新大量数据的时候,如果插入次数过多(我测试的也不多,也就比上面摆出的多了三次),会严重影响mysql的插入速度与性能。

4、随着字段中数据量的增多,表占用的空间并不是一成不变的。而且也并没有根据插入字符所占字节的多少呈现符合常理的变化。

注:怪不得别人都说mysql是个坑,如果这样的话,这样就应该解决了前几天的那个疑问,也解决了我之前一直想不清楚的疑问。如何解决这个问题,还需要更深一步的研究一下mysql。

以上是关于数据库类型空间效率探索的主要内容,如果未能解决你的问题,请参考以下文章

数据库类型空间效率探索-tinyint与enum与set

集合-Collection类

混合类型的Matlab数据结构 - 啥是时间+空间效率?

Linq专题之提高编码效率—— 第二篇 神一样的匿名类型

变量与数据类型

集合的简单总结