MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

Posted 2021-03-17 少年阿斌

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？相关的知识，希望对你有一定的参考价值。

首先就其准确性说，这世界上有无数种文字，除了通用的英文使用我们较熟悉的 A-Z 字符外，还有很多种近似的写法用于法文、德文、俄文等等…

技术图片

光是一个 A 字就有数十种不同表现
为什么不都用同一种 A 呢，几十种多麻烦啊。事实上，它们在所属的文字上都各有意义，可能代表不同的发音，也可能是其他东西。在某些语言上，同一个单词不同发音可能就代表两个意思。

校对规则

utf8_unicode_ci 及 utf8_general_ci 的用途就是对那些看起来不一样的字符进行转换，令我们进行排序比对时更方便准确。

以下面为例，直接看起来是不相等的，但在实际应用上是成立的，这就是 utf8_unicode_ci 及 utf8_general_ci 工作的结果。
Ä = A
Ö = O
Ü = U

而 utf8_unicode_ci 准确性较好就表现在它有更完整的字元对照表上，它甚至可以将一个特别字符转换成多于一个英文字符，以德文中的 s 例:

在 utf8_unicode_ci 下面等式是成立
ß = ss

在 utf8_general_ci 只有这样才成立
ß = s

因为 utf8_unicode_ci 有更完整字符表及转换规则，所以在排序的准确性上也比 utf8_general_ci 高一些。

utf8_general_ci 字符表的一部份

utf8_unicode_ci 有更完整的字符表

同样因为 utf8_unicode_ci 的字符表及转换规则更复杂，所以在效能上比 utf8_general_ci 慢。

如果你的应用是德文、俄文等等，或者需要精确处理国际化的内容，请用 utf8_unicode_ci 。
否则的话用 utf8_general_ci 就可以了。

虽然说 utf8_unicode_ci 的字集比较完整，但其实还是不全的，所以 mysql 还提供了很多种其他语言的专用字集，用于特别的本地应用，详细可以看看下面的官网连结

參考

以上是关于MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？的主要内容，如果未能解决你的问题，请参考以下文章