utf8_general_ci 中哪些字符是等价的?
Posted
技术标签:
【中文标题】utf8_general_ci 中哪些字符是等价的?【英文标题】:What characters are equivalent in utf8_general_ci? 【发布时间】:2014-08-08 16:58:27 【问题描述】:显然,大写和小写字母被认为是等价的。但这是否仅适用于拉丁字符或更多字母?希腊语等?
哪些重音字母被认为是等价的?在德语排序规则中,ü
等于 u
或 ue
,具体取决于您使用的是哪一个。 utf8_general_ci
有这样的东西吗?
等价性到底有多远?平假名ね
和片假名ネ
都代表同一个音节,那么它们在排序规则中算不算等价?
我似乎找不到任何关于此的信息,考虑到它对唯一键之类的重要性应该是多么重要,这很奇怪......
【问题讨论】:
【参考方案1】:您可以找到here,“它只是删除所有重音,然后转换为大写”。
如果您不想检查这个,只需使用 utf8_unicode_ci - 它不会做这些事情,而且速度也更快。所以,如果你不需要它,就不要使用它!
还有那些日本人……我真的不知道。但是很容易检查...
来源:http://forums.mysql.com/read.php?103,187048,188748
【讨论】:
以上是关于utf8_general_ci 中哪些字符是等价的?的主要内容,如果未能解决你的问题,请参考以下文章
使用 utf8_general_ci 排序规则和 utf8 字符集服务器的德语变音符号的搜索结果区分大小写
MySQL_编码utf8_bin和utf8_general_ci的区别
mysql字符集问题 错误代码: 1267 Illegal mix of collations (utf8_general_ci,IMPLICIT) and (utf8_croatian_ci,IM