转载十分钟搞清字符集和字符编码
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转载十分钟搞清字符集和字符编码相关的知识,希望对你有一定的参考价值。
原文地址:http://cenalulu.github.io/linux/character-encoding/
原文作者:Junyi Lu,卢钧轶
本文将简述字符集,字符编码的概念。以及在遭遇乱码时的一些常用诊断技巧
背景:字符集和编码无疑是IT菜鸟甚至是各种大神的头痛问题。当遇到纷繁复杂的字符集,各种火星文和乱码时,问题的定位往往变得非常困难。本文就将会从原理方面对字符集和编码做个简单的科普介绍,同时也会介绍一些通用的乱码故障定位的方法以方便读者以后能够更从容的定位相关问题。在正式介绍之前,先做个小申明:如果你希望非常精确的理解各个名词的解释,那么可以查阅wikipedia。本文是博主通过自己理解消化后并转化成易懂浅显的表述后的介绍。
其他部分看原文,原文板式很好看。
以上是关于转载十分钟搞清字符集和字符编码的主要内容,如果未能解决你的问题,请参考以下文章
字符编码笔记:ASCII,Unicode和UTF-8(转载)
Java如何检测替换4个字节的utf-8编码(此范围编码包含emoji)