utf8_general_ci 中哪些字符是等价的?

Posted

技术标签:

【中文标题】utf8_general_ci 中哪些字符是等价的?【英文标题】:What characters are equivalent in utf8_general_ci? 【发布时间】:2014-08-08 16:58:27 【问题描述】:

显然,大写和小写字母被认为是等价的。但这是否仅适用于拉丁字符或更多字母?希腊语等?

哪些重音字母被认为是等价的?在德语排序规则中,ü 等于 uue,具体取决于您使用的是哪一个。 utf8_general_ci有这样的东西吗?

等价性到底有多远?平假名 和片假名 都代表同一个音节,那么它们在排序规则中算不算等价?

我似乎找不到任何关于此的信息,考虑到它对唯一键之类的重要性应该是多么重要,这很奇怪......

【问题讨论】:

【参考方案1】:

您可以找到here,“它只是删除所有重音,然后转换为大写”。

如果您不想检查这个,只需使用 utf8_unicode_ci - 它不会做这些事情,而且速度也更快。所以,如果你不需要它,就不要使用它!

还有那些日本人……我真的不知道。但是很容易检查...

来源:http://forums.mysql.com/read.php?103,187048,188748

【讨论】:

以上是关于utf8_general_ci 中哪些字符是等价的?的主要内容,如果未能解决你的问题,请参考以下文章

使用 utf8_general_ci 排序规则和 utf8 字符集服务器的德语变音符号的搜索结果区分大小写

MySQL_编码utf8_bin和utf8_general_ci的区别

utf8_bin跟utf8_general_ci的区别

mysql字符集校对

php中数组可以使用哪些键名

mysql字符集问题 错误代码: 1267 Illegal mix of collations (utf8_general_ci,IMPLICIT) and (utf8_croatian_ci,IM