MySQL字符集和排序规则详解

Posted Linux技术狂

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL字符集和排序规则详解相关的知识,希望对你有一定的参考价值。

一. 相关概念

1. 字符集

 mysql提供了多种字符集和排序规则选择,其中字符集设置和数据存储以及客户端与MySQL实例的交互相关,排序规则和字符串的对比规则相关

(1). 字符集的设置可以在MySQL实例、数据库、表、列四个级别

(2). MySQL设置字符集支持在InnoDB, MyISAM, Memory三个存储引擎

(3). 查看当前MySQL支持的字符集的方式有两种,一种是通过查看information_schema.character_set系统表,一种是通过命令【 show character set; 】查看。

2. 排序规则

 每个指定的字符集都会有一个或多个支持的排序规则,可以通过两种方式查看,一种是查看information_schema.collations表,另一种是通过【show collation】命令查看

(1). 查看utf8mb4字符集对应的排序规则有哪些。

show collation where charset ='utf8mb4';

(2).剖析排序规则

排序规则的命令通常是以对应的字符集的名字为开头,并以自己的特定属性结尾,比如排序规则utf8_general_ci和latin1_swedish_ci就分别是对应utf8和latin1字符集的排序规则

• 当排序规则特指某种语言时,则中间的部分就为这种语言的名字,比如utf8_turkish_ci和utf8_hungarian_ci就代表UTF8字符集中的土耳其语和匈牙利语

• 排序规则名字的结尾字符代表是否大小写敏感,重音敏感以及是否是二进制的

PS:

A. 当仅指定了字符集而没有指定排序规则时,则会使用该字符集的默认排序规则

B. 当仅指定了排序规则而没有字符集时,则在该排序规则名称上含有的字符集会被使用

C. 当数据库创建时没有指定这两项,则使用实例级别的字符集和排序规则

更多C++后台开发技术点知识内容包括C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,MongoDB,ZK,流媒体,音视频开发,Linux内核,TCP/IP,协程,DPDK多个高级知识点。

C/C++Linux服务器开发高级架构师/C++后台开发架构师免费学习地址

【文章福利】另外还整理一些C++后台开发架构师 相关学习资料,面试题,教学视频,以及学习路线图,免费分享有需要的可以点击领取

二. 实操

1. 查看数据库编码

 windows下mysql5.7默认编码如下图

show variables like '%character%';

PS:

(1). 每个数据库客户端连接都有自己的字符集和排序规则属性,客户端发送的语句的字符集是由character_set_client决定,而与服务端交互时会根据character_set_connection和collation_connection两个参数将接收到的语句转化。当涉及到显示字符串的比较时,由collation_connection参数决定,而当比较的是字段里的字符串时则根据字段本身的排序规则决定

(2). character_set_result 参数决定了语句的执行结果以什么字符集返回给客户端

(3). 客户端可以很方便的调整字符集和排序规则,比如使用SET NAMES'charset_name' [COLLATE 'collation_name']表明后续的语句都以该字符集格式传送给服务端,而执行结果也以此字符集格式返回。

SET character_set_client = utf8mb4; SET character_set_results = utf8mb4; SET character_set_connection = utf8mb4;

2. 安装完MySQL后的通用配置

 MySQL5.7以后,推荐使用utf8mb4编码来代替utf8编码。

 无论window下还是linux下的mysql安装完成后首先要做的就是修改编码,下面蓝色部分是需要配置的。修改完成后,重启mysql服务,查看编码。

[client]
default-character-set=utf8mb4

[mysql]
default-character-set=utf8mb4

[mysqld]
# 设置client连接mysql时的字符集,防止乱码
init_connect='SET NAMES utf8mb4'
init_connect='SET collation_connection = utf8mb4_general_ci'

# 数据库默认字符集
character-set-server=utf8mb4

#数据库字符集对应一些排序等规则,注意要和character-set-server对应
collation-server=utf8mb4_general_ci

# 跳过mysql程序起动时的字符参数设置 ,使用服务器端字符集设置 (忽略即可)
#skip-character-set-client-handshake

# 禁止MySQL对外部连接进行DNS解析,使用这一选项可以消除MySQL进行DNS解析的时间。但需要注意,如果开启该选项,则所有远程主机连接授权都要使用IP地址方式,否则MySQL将无法正常处理连接请求!(忽略即可)
#skip-name-resolve

原文链接:第六节:MySQL字符集和排序规则详解 - Yaopengfei - 博客园

Mysql:修改字符集和排序规则

Mysql:修改字符集和排序规则


数据表在进行联表查询时,表的排序规则需要相同。

说明:
排序规则生效优先级:字段 》表 》库

一、数据库

— 修改数据库字符集和排序规则

alter database xc  character 
set utf8 collate utf8_general_ci;

— 查看数据库的字符集

select * from information_schema.schemata 
where schema_name = 'db_name';

二、数据表

— 修改表默认的字符集

alter table table_name character 
set gbk collate gbk_bin;

— 查看表的字符集

select * from information_schema.tables 
where table_schema = 'db_name' 
and table_name = 'table_name';

三、表字段

— 修改字段的字符集

ALTER TABLE table_name 
CHANGE `column_name` `column_name` VARCHAR(40) 
CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

— 批量修改表字段的字符集

alter table table_name convert to character 
set gbk collate gbk_bin;

— 查看字段的字符集

select * from information_schema.columns 
where table_schema = 'db_name' 
and table_name = 'table_name';

以上是关于MySQL字符集和排序规则详解的主要内容,如果未能解决你的问题,请参考以下文章

mysql汉字排序规则

MySQL字符集与排序规则 北京MySQL DBA学习

Mysql:修改字符集和排序规则

MySQL如何指定字符集和排序规则?

mysql中字符集和排序规则说明

详细讲解MySQL的字符集与排序规则/校对规则(charactercollate)