MySql 中文乱码排查解决方案

Posted 郑兴鹏

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySql 中文乱码排查解决方案相关的知识,希望对你有一定的参考价值。

阅读目录

mysql会出现中文乱码的原因不外乎下列几点:

  • server本身设定问题,例如还停留在latin1
  • table的语系设定问题(包含character与collation)
  • 客户端程式(例如php)的连线语系设定问题

1.避免创建数据库及表出现中文乱码和查看编码方法

a.创建数据库的时候

CREATE DATABASE `test` CHARACTER SET \'utf8\' COLLATE \'utf8_general_ci\';

b.建表的时候

复制代码
CREATE TABLE `database_user` (
`ID` varchar(40) NOT NULL default \'\',
`UserID` varchar(40) NOT NULL default \'\',
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
复制代码

建库和建表时都使用相同的编码格式,基本上不会出问题。

程序连接配置数据链接时:

jdbc:mysql://localhost:3306/database?useUnicode=true&characterEncoding=UTF-8 

如果上面的这种方式不行,试试这样写:

jdbc:mysql://localhost:3306/database?characterEncoding=UTF-8 

c.如果你已经建了库和表可以通过以下方式进行查询:
查看默认的编码格式:

show variables like "%char%";

+--------------------------+---------------+
| Variable_name | Value |
+--------------------------+---------------+
| character_set_client | gbk |
| character_set_connection | gbk |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | gbk |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+-------------+
注:以前2个来确定,可以使用set names utf8,set names gbk设置默认的编码格式;

执行SET NAMES utf8的效果等同于同时设定如下:

SET character_set_client=\'utf8\';
SET character_set_connection=\'utf8\';
SET character_set_results=\'utf8\';

查看test数据库的编码格式:

show create database test;

+------------+------------------------------------------------------------------------------------------------+
| Database | Create Database |
+------------+------------------------------------------------------------------------------------------------+
| test | CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET gbk */ |
+------------+------------------------------------------------------------------------------------------------+

查看yjdb数据库的编码格式:

复制代码
 show create table yjdb;

| yjdb | CREATE TABLE `yjdb` (
`sn` int(5) NOT NULL AUTO_INCREMENT,
`type` varchar(10) NOT NULL,
`brc` varchar(6) NOT NULL,
`teller` int(6) NOT NULL,
`telname` varchar(10) NOT NULL,
`date` int(10) NOT NULL,
`count` int(6) NOT NULL,
`back` int(10) NOT NULL,
PRIMARY KEY (`sn`),
UNIQUE KEY `sn` (`sn`),
UNIQUE KEY `sn_2` (`sn`)
) ENGINE=MyISAM AUTO_INCREMENT=1826 DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC |
复制代码

2.避免导入数据有中文乱码的问题

a.将数据编码格式保存为utf-8
设置默认编码为utf8:

set names utf8;

设置数据库db_name默认为utf8:

ALTER DATABASE `db_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

设置表tb_name默认编码为utf8:

ALTER TABLE `tb_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

导入:

LOAD DATA LOCAL INFILE \'C:\\\\utf8.txt\' INTO TABLE yjdb;

b.将数据编码格式保存为ansi(即GBK或GB2312)
设置默认编码为gbk:

set names gbk;

设置数据库db_name默认编码为gbk:

ALTER DATABASE `db_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;

设置表tb_name默认编码为gbk:

ALTER TABLE `tb_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;

导入:

LOAD DATA LOCAL INFILE \'C:\\\\gbk.txt\' INTO TABLE yjdb;

注意:UTF8不要导入gbk,gbk不要导入UTF8;dos下不支持UTF8的显示;

3.解决网页中乱码的问题

将网站编码设为 utf-8,这样可以兼容世界上所有字符。
如果网站已经运作了好久,已有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为 GBK, GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。
a.编辑/etc/my.cnf ,在[mysql]段加入

default_character_set=utf8;

b.在编写Connection URL时,加上

?useUnicode=true&characterEncoding=utf-8

c.在网页代码中加上一个"set names utf8"或者"set names gbk"的指令,告诉MySQL连线内容都要使用utf8或者gbk;

以上是关于MySql 中文乱码排查解决方案的主要内容,如果未能解决你的问题,请参考以下文章

tomcat环境中文字符集乱码

mysql数据库乱码的问题解决

HttpClient中文乱码问题排查

mysql5.6运行一段时间之后网站页面出现乱码解决办法

MYSQL数据库使用UTF-8中文编码乱码的解决办法

jdbc获取blob类型乱码