所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)相关的知识,希望对你有一定的参考价值。
本页列出来目前window下所有支持的字符编码 ---通过 System.Text.Encoding.GetEncodings()获取,里面可以对其进行查询,筛选,对同一个字符,在不同编码进行查看和分析。。。
代码页编号 | 名称 | 代码 | 类型 | 单字节码位 |
---|---|---|---|---|
37 | IBM EBCDIC (美国-加拿大) | IBM037 | SBCSCodePageEncoding | 是 |
437 | OEM 美国 | IBM437 | SBCSCodePageEncoding | 是 |
500 | IBM EBCDIC (国际) | IBM500 | SBCSCodePageEncoding | 是 |
708 | 阿拉伯字符(ASMO-708) | ASMO-708 | SBCSCodePageEncoding | 是 |
720 | 阿拉伯字符(DOS) | DOS-720 | SBCSCodePageEncoding | 是 |
737 | 希腊字符(DOS) | ibm737 | SBCSCodePageEncoding | 是 |
775 | 波罗的海字符(DOS) | ibm775 | SBCSCodePageEncoding | 是 |
850 | 西欧字符(DOS) | ibm850 | SBCSCodePageEncoding | 是 |
852 | 中欧字符(DOS) | ibm852 | SBCSCodePageEncoding | 是 |
855 | OEM 西里尔语 | IBM855 | SBCSCodePageEncoding | 是 |
857 | 土耳其字符(DOS) | ibm857 | SBCSCodePageEncoding | 是 |
858 | OEM 多语言拉丁语 I | IBM00858 | SBCSCodePageEncoding | 是 |
860 | 葡萄牙语(DOS) | IBM860 | SBCSCodePageEncoding | 是 |
861 | 冰岛语(DOS) | ibm861 | SBCSCodePageEncoding | 是 |
862 | 希伯来字符(DOS) | DOS-862 | SBCSCodePageEncoding | 是 |
863 | 加拿大法语(DOS) | IBM863 | SBCSCodePageEncoding | 是 |
864 | 阿拉伯字符(864) | IBM864 | SBCSCodePageEncoding | 是 |
865 | 北欧字符(DOS) | IBM865 | SBCSCodePageEncoding | 是 |
866 | 西里尔字符(DOS) | cp866 | SBCSCodePageEncoding | 是 |
869 | 现代希腊字符(DOS) | ibm869 | SBCSCodePageEncoding | 是 |
870 | IBM EBCDIC (多语言拉丁语 2) | IBM870 | SBCSCodePageEncoding | 是 |
874 | 泰语(Windows) | windows-874 | SBCSCodePageEncoding | 是 |
875 | IBM EBCDIC (现代希腊语) | cp875 | SBCSCodePageEncoding | 是 |
932 | 日语(Shift-JIS) | shift_jis | DBCSCodePageEncoding | -- |
936 | 简体中文(GB2312) | gb2312 | DBCSCodePageEncoding | -- |
949 | 朝鲜语 | ks_c_5601-1987 | DBCSCodePageEncoding | -- |
950 | 繁体中文(Big5) | big5 | DBCSCodePageEncoding | -- |
1026 | IBM EBCDIC (土耳其拉丁语 5) | IBM1026 | SBCSCodePageEncoding | 是 |
1047 | IBM 拉丁语 1 | IBM01047 | SBCSCodePageEncoding | 是 |
1140 | IBM EBCDIC (美国-加拿大-欧洲) | IBM01140 | SBCSCodePageEncoding | 是 |
1141 | IBM EBCDIC (德国-欧洲) | IBM01141 | SBCSCodePageEncoding | 是 |
1142 | IBM EBCDIC (丹麦-挪威-欧洲) | IBM01142 | SBCSCodePageEncoding | 是 |
1143 | IBM EBCDIC (芬兰-瑞典-欧洲) | IBM01143 | SBCSCodePageEncoding | 是 |
1144 | IBM EBCDIC (意大利-欧洲) | IBM01144 | SBCSCodePageEncoding | 是 |
1145 | IBM EBCDIC (西班牙-欧洲) | IBM01145 | SBCSCodePageEncoding | 是 |
1146 | IBM EBCDIC (英国-欧洲) | IBM01146 | SBCSCodePageEncoding | 是 |
1147 | IBM EBCDIC (法国-欧洲) | IBM01147 | SBCSCodePageEncoding | 是 |
1148 | IBM EBCDIC (国际-欧洲) | IBM01148 | SBCSCodePageEncoding | 是 |
1149 | IBM EBCDIC (冰岛语-欧洲) | IBM01149 | SBCSCodePageEncoding | 是 |
1200 | Unicode | utf-16 | UnicodeEncoding | -- |
1201 | Unicode (Big-Endian) | utf-16BE | UnicodeEncoding | -- |
1250 | 中欧字符(Windows) | windows-1250 | SBCSCodePageEncoding | 是 |
1251 | 西里尔字符(Windows) | windows-1251 | SBCSCodePageEncoding | 是 |
1252 | 西欧字符(Windows) | Windows-1252 | SBCSCodePageEncoding | 是 |
1253 | 希腊字符(Windows) | windows-1253 | SBCSCodePageEncoding | 是 |
1254 | 土耳其字符(Windows) | windows-1254 | SBCSCodePageEncoding | 是 |
1255 | 希伯来字符(Windows) | windows-1255 | SBCSCodePageEncoding | 是 |
1256 | 阿拉伯字符(Windows) | windows-1256 | SBCSCodePageEncoding | 是 |
1257 | 波罗的海字符(Windows) | windows-1257 | SBCSCodePageEncoding | 是 |
1258 | 越南字符(Windows) | windows-1258 | SBCSCodePageEncoding | 是 |
1361 | 朝鲜语(Johab) | Johab | DBCSCodePageEncoding | -- |
10000 | 西欧字符(Mac) | macintosh | SBCSCodePageEncoding | 是 |
10001 | 日语(Mac) | x-mac-japanese | DBCSCodePageEncoding | -- |
10002 | 繁体中文(Mac) | x-mac-chinesetrad | DBCSCodePageEncoding | -- |
10003 | 朝鲜语(Mac) | x-mac-korean | DBCSCodePageEncoding | -- |
10004 | 阿拉伯字符(Mac) | x-mac-arabic | SBCSCodePageEncoding | 是 |
10005 | 希伯来字符(Mac) | x-mac-hebrew | SBCSCodePageEncoding | 是 |
10006 | 希腊字符(Mac) | x-mac-greek | SBCSCodePageEncoding | 是 |
10007 | 西里尔字符(Mac) | x-mac-cyrillic | SBCSCodePageEncoding | 是 |
10008 | 简体中文(Mac) | x-mac-chinesesimp | DBCSCodePageEncoding | -- |
10010 | 罗马尼亚语(Mac) | x-mac-romanian | SBCSCodePageEncoding | 是 |
10017 | 乌克兰语(Mac) | x-mac-ukrainian | SBCSCodePageEncoding | 是 |
10021 | 泰语(Mac) | x-mac-thai | SBCSCodePageEncoding | 是 |
10029 | 中欧字符(Mac) | x-mac-ce | SBCSCodePageEncoding | 是 |
10079 | 冰岛语(Mac) | x-mac-icelandic | SBCSCodePageEncoding | 是 |
10081 | 土耳其字符(Mac) | x-mac-turkish | SBCSCodePageEncoding | 是 |
10082 | 克罗地亚语(Mac) | x-mac-croatian | SBCSCodePageEncoding | 是 |
12000 | Unicode (UTF-32) | utf-32 | UTF32Encoding | -- |
12001 | Unicode (UTF-32 Big-Endian) | utf-32BE | UTF32Encoding | -- |
20000 | 繁体中文(CNS) | x-Chinese-CNS | DBCSCodePageEncoding | -- |
20001 | TCA 台湾 | x-cp20001 | DBCSCodePageEncoding | -- |
20002 | 繁体中文(Eten) | x-Chinese-Eten | DBCSCodePageEncoding | -- |
20003 | IBM5550 台湾 | x-cp20003 | DBCSCodePageEncoding | -- |
20004 | TeleText 台湾 | x-cp20004 | DBCSCodePageEncoding | -- |
20005 | Wang 台湾 | x-cp20005 | DBCSCodePageEncoding | -- |
20105 | 西欧字符(IA5) | x-IA5 | SBCSCodePageEncoding | 是 |
20106 | 德语(IA5) | x-IA5-German | SBCSCodePageEncoding | 是 |
20107 | 瑞典语(IA5) | x-IA5-Swedish | SBCSCodePageEncoding | 是 |
20108 | 挪威语(IA5) | x-IA5-Norwegian | SBCSCodePageEncoding | 是 |
20127 | US-ASCII | us-ascii | ASCIIEncoding | 是 |
20261 | T.61 | x-cp20261 | DBCSCodePageEncoding | -- |
20269 | ISO-6937 | x-cp20269 | SBCSCodePageEncoding | 是 |
20273 | IBM EBCDIC (德国) | IBM273 | SBCSCodePageEncoding | 是 |
20277 | IBM EBCDIC (丹麦-挪威) | IBM277 | SBCSCodePageEncoding | 是 |
20278 | IBM EBCDIC (芬兰-瑞典) | IBM278 | SBCSCodePageEncoding | 是 |
20280 | IBM EBCDIC (意大利) | IBM280 | SBCSCodePageEncoding | 是 |
20284 | IBM EBCDIC (西班牙) | IBM284 | SBCSCodePageEncoding | 是 |
20285 | IBM EBCDIC (UK) | IBM285 | SBCSCodePageEncoding | 是 |
20290 | IBM EBCDIC (日语片假名) | IBM290 | SBCSCodePageEncoding | 是 |
20297 | IBM EBCDIC (法国) | IBM297 | SBCSCodePageEncoding | 是 |
20420 | IBM EBCDIC (阿拉伯语) | IBM420 | SBCSCodePageEncoding | 是 |
20423 | IBM EBCDIC (希腊语) | IBM423 | SBCSCodePageEncoding | 是 |
20424 | IBM EBCDIC (希伯来语) | IBM424 | SBCSCodePageEncoding | 是 |
20833 | IBM EBCDIC (朝鲜语扩展) | x-EBCDIC-KoreanExtended | SBCSCodePageEncoding | 是 |
20838 | IBM EBCDIC (泰语) | IBM-Thai | SBCSCodePageEncoding | 是 |
20866 | 西里尔字符(KOI8-R) | koi8-r | SBCSCodePageEncoding | 是 |
20871 | IBM EBCDIC (冰岛语) | IBM871 | SBCSCodePageEncoding | 是 |
20880 | IBM EBCDIC (西里尔俄语) | IBM880 | SBCSCodePageEncoding | 是 |
20905 | IBM EBCDIC (土耳其语) | IBM905 | SBCSCodePageEncoding | 是 |
20924 | IBM 拉丁语 1 | IBM00924 | SBCSCodePageEncoding | 是 |
20932 | 日语(JIS 0208-1990 和 0212-1990) | EUC-JP | DBCSCodePageEncoding | -- |
20936 | 简体中文(GB2312-80) | x-cp20936 | DBCSCodePageEncoding | -- |
20949 | 朝鲜语 Wansung | x-cp20949 | DBCSCodePageEncoding | -- |
21025 | IBM EBCDIC (西里尔塞尔维亚-保加利亚语) | cp1025 | SBCSCodePageEncoding | 是 |
21866 | 西里尔字符(KOI8-U) | koi8-u | SBCSCodePageEncoding | 是 |
28591 | 西欧字符(ISO) | iso-8859-1 | Latin1Encoding | 是 |
28592 | 中欧字符(ISO) | iso-8859-2 | SBCSCodePageEncoding | 是 |
28593 | 拉丁语 3 (ISO) | iso-8859-3 | SBCSCodePageEncoding | 是 |
28594 | 波罗的海字符(ISO) | iso-8859-4 | SBCSCodePageEncoding | 是 |
28595 | 西里尔字符(ISO) | iso-8859-5 | SBCSCodePageEncoding | 是 |
28596 | 阿拉伯字符(ISO) | iso-8859-6 | SBCSCodePageEncoding | 是 |
28597 | 希腊字符(ISO) | iso-8859-7 | SBCSCodePageEncoding | 是 |
28598 | 希伯来字符(ISO-Visual) | iso-8859-8 | SBCSCodePageEncoding | 是 |
28599 | 土耳其字符(ISO) | iso-8859-9 | SBCSCodePageEncoding | 是 |
28603 | 爱沙尼亚语(ISO) | iso-8859-13 | SBCSCodePageEncoding | 是 |
28605 | 拉丁语 9 (ISO) | iso-8859-15 | SBCSCodePageEncoding | 是 |
29001 | 欧罗巴 | x-Europa | SBCSCodePageEncoding | 是 |
38598 | 希伯来字符(ISO-Logical) | iso-8859-8-i | SBCSCodePageEncoding | 是 |
50220 | 日语(JIS) | iso-2022-jp | ISO2022Encoding | -- |
50221 | 日语(JIS-允许 1 字节假名) | csISO2022JP | ISO2022Encoding | -- |
50222 | 日语(JIS-允许 1 字节假名 - SO/SI) | iso-2022-jp | ISO2022Encoding | -- |
50225 | 朝鲜语(ISO) | iso-2022-kr | ISO2022Encoding | -- |
50227 | 简体中文(ISO-2022) | x-cp50227 | DBCSCodePageEncoding | -- |
51932 | 日语(EUC) | euc-jp | EUCJPEncoding | -- |
51936 | 简体中文(EUC) | EUC-CN | DBCSCodePageEncoding | -- |
51949 | 朝鲜语(EUC) | euc-kr | DBCSCodePageEncoding | -- |
52936 | 简体中文(HZ) | hz-gb-2312 | ISO2022Encoding | -- |
54936 | 简体中文(GB18030) | GB18030 | GB18030Encoding | -- |
57002 | ISCII 梵文 | x-iscii-de | ISCIIEncoding | -- |
57003 | ISCII 孟加拉语 | x-iscii-be | ISCIIEncoding | -- |
57004 | ISCII 泰米尔语 | x-iscii-ta | ISCIIEncoding | -- |
57005 | ISCII 泰卢固语 | x-iscii-te | ISCIIEncoding | -- |
57006 | ISCII 阿萨姆语 | x-iscii-as | ISCIIEncoding | -- |
57007 | ISCII 奥里雅语 | x-iscii-or | ISCIIEncoding | -- |
57008 | ISCII 卡纳达语 | x-iscii-ka | ISCIIEncoding | -- |
57009 | ISCII 马拉雅拉姆语 | x-iscii-ma | ISCIIEncoding | -- |
57010 | ISCII 古吉拉特语 | x-iscii-gu | ISCIIEncoding | -- |
57011 | ISCII 旁遮普语 | x-iscii-pa | ISCIIEncoding | -- |
65000 | Unicode (UTF-7) | utf-7 | UTF7Encoding | -- |
65001 | Unicode (UTF-8) | utf-8 | UTF8Encoding | -- |
以上是关于所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)的主要内容,如果未能解决你的问题,请参考以下文章