所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)相关的知识,希望对你有一定的参考价值。

 

本页列出来目前window下所有支持的字符编码  ---通过 System.Text.Encoding.GetEncodings()获取,里面可以对其进行查询,筛选,对同一个字符,在不同编码进行查看和分析。。。

 

代码页编号名称代码类型单字节码位
37 IBM EBCDIC (美国-加拿大) IBM037 SBCSCodePageEncoding
437 OEM 美国 IBM437 SBCSCodePageEncoding
500 IBM EBCDIC (国际) IBM500 SBCSCodePageEncoding
708 阿拉伯字符(ASMO-708) ASMO-708 SBCSCodePageEncoding
720 阿拉伯字符(DOS) DOS-720 SBCSCodePageEncoding
737 希腊字符(DOS) ibm737 SBCSCodePageEncoding
775 波罗的海字符(DOS) ibm775 SBCSCodePageEncoding
850 西欧字符(DOS) ibm850 SBCSCodePageEncoding
852 中欧字符(DOS) ibm852 SBCSCodePageEncoding
855 OEM 西里尔语 IBM855 SBCSCodePageEncoding
857 土耳其字符(DOS) ibm857 SBCSCodePageEncoding
858 OEM 多语言拉丁语 I IBM00858 SBCSCodePageEncoding
860 葡萄牙语(DOS) IBM860 SBCSCodePageEncoding
861 冰岛语(DOS) ibm861 SBCSCodePageEncoding
862 希伯来字符(DOS) DOS-862 SBCSCodePageEncoding
863 加拿大法语(DOS) IBM863 SBCSCodePageEncoding
864 阿拉伯字符(864) IBM864 SBCSCodePageEncoding
865 北欧字符(DOS) IBM865 SBCSCodePageEncoding
866 西里尔字符(DOS) cp866 SBCSCodePageEncoding
869 现代希腊字符(DOS) ibm869 SBCSCodePageEncoding
870 IBM EBCDIC (多语言拉丁语 2) IBM870 SBCSCodePageEncoding
874 泰语(Windows) windows-874 SBCSCodePageEncoding
875 IBM EBCDIC (现代希腊语) cp875 SBCSCodePageEncoding
932 日语(Shift-JIS) shift_jis DBCSCodePageEncoding --
936 简体中文(GB2312) gb2312 DBCSCodePageEncoding --
949 朝鲜语 ks_c_5601-1987 DBCSCodePageEncoding --
950 繁体中文(Big5) big5 DBCSCodePageEncoding --
1026 IBM EBCDIC (土耳其拉丁语 5) IBM1026 SBCSCodePageEncoding
1047 IBM 拉丁语 1 IBM01047 SBCSCodePageEncoding
1140 IBM EBCDIC (美国-加拿大-欧洲) IBM01140 SBCSCodePageEncoding
1141 IBM EBCDIC (德国-欧洲) IBM01141 SBCSCodePageEncoding
1142 IBM EBCDIC (丹麦-挪威-欧洲) IBM01142 SBCSCodePageEncoding
1143 IBM EBCDIC (芬兰-瑞典-欧洲) IBM01143 SBCSCodePageEncoding
1144 IBM EBCDIC (意大利-欧洲) IBM01144 SBCSCodePageEncoding
1145 IBM EBCDIC (西班牙-欧洲) IBM01145 SBCSCodePageEncoding
1146 IBM EBCDIC (英国-欧洲) IBM01146 SBCSCodePageEncoding
1147 IBM EBCDIC (法国-欧洲) IBM01147 SBCSCodePageEncoding
1148 IBM EBCDIC (国际-欧洲) IBM01148 SBCSCodePageEncoding
1149 IBM EBCDIC (冰岛语-欧洲) IBM01149 SBCSCodePageEncoding
1200 Unicode utf-16 UnicodeEncoding --
1201 Unicode (Big-Endian) utf-16BE UnicodeEncoding --
1250 中欧字符(Windows) windows-1250 SBCSCodePageEncoding
1251 西里尔字符(Windows) windows-1251 SBCSCodePageEncoding
1252 西欧字符(Windows) Windows-1252 SBCSCodePageEncoding
1253 希腊字符(Windows) windows-1253 SBCSCodePageEncoding
1254 土耳其字符(Windows) windows-1254 SBCSCodePageEncoding
1255 希伯来字符(Windows) windows-1255 SBCSCodePageEncoding
1256 阿拉伯字符(Windows) windows-1256 SBCSCodePageEncoding
1257 波罗的海字符(Windows) windows-1257 SBCSCodePageEncoding
1258 越南字符(Windows) windows-1258 SBCSCodePageEncoding
1361 朝鲜语(Johab) Johab DBCSCodePageEncoding --
10000 西欧字符(Mac) macintosh SBCSCodePageEncoding
10001 日语(Mac) x-mac-japanese DBCSCodePageEncoding --
10002 繁体中文(Mac) x-mac-chinesetrad DBCSCodePageEncoding --
10003 朝鲜语(Mac) x-mac-korean DBCSCodePageEncoding --
10004 阿拉伯字符(Mac) x-mac-arabic SBCSCodePageEncoding
10005 希伯来字符(Mac) x-mac-hebrew SBCSCodePageEncoding
10006 希腊字符(Mac) x-mac-greek SBCSCodePageEncoding
10007 西里尔字符(Mac) x-mac-cyrillic SBCSCodePageEncoding
10008 简体中文(Mac) x-mac-chinesesimp DBCSCodePageEncoding --
10010 罗马尼亚语(Mac) x-mac-romanian SBCSCodePageEncoding
10017 乌克兰语(Mac) x-mac-ukrainian SBCSCodePageEncoding
10021 泰语(Mac) x-mac-thai SBCSCodePageEncoding
10029 中欧字符(Mac) x-mac-ce SBCSCodePageEncoding
10079 冰岛语(Mac) x-mac-icelandic SBCSCodePageEncoding
10081 土耳其字符(Mac) x-mac-turkish SBCSCodePageEncoding
10082 克罗地亚语(Mac) x-mac-croatian SBCSCodePageEncoding
12000 Unicode (UTF-32) utf-32 UTF32Encoding --
12001 Unicode (UTF-32 Big-Endian) utf-32BE UTF32Encoding --
20000 繁体中文(CNS) x-Chinese-CNS DBCSCodePageEncoding --
20001 TCA 台湾 x-cp20001 DBCSCodePageEncoding --
20002 繁体中文(Eten) x-Chinese-Eten DBCSCodePageEncoding --
20003 IBM5550 台湾 x-cp20003 DBCSCodePageEncoding --
20004 TeleText 台湾 x-cp20004 DBCSCodePageEncoding --
20005 Wang 台湾 x-cp20005 DBCSCodePageEncoding --
20105 西欧字符(IA5) x-IA5 SBCSCodePageEncoding
20106 德语(IA5) x-IA5-German SBCSCodePageEncoding
20107 瑞典语(IA5) x-IA5-Swedish SBCSCodePageEncoding
20108 挪威语(IA5) x-IA5-Norwegian SBCSCodePageEncoding
20127 US-ASCII us-ascii ASCIIEncoding
20261 T.61 x-cp20261 DBCSCodePageEncoding --
20269 ISO-6937 x-cp20269 SBCSCodePageEncoding
20273 IBM EBCDIC (德国) IBM273 SBCSCodePageEncoding
20277 IBM EBCDIC (丹麦-挪威) IBM277 SBCSCodePageEncoding
20278 IBM EBCDIC (芬兰-瑞典) IBM278 SBCSCodePageEncoding
20280 IBM EBCDIC (意大利) IBM280 SBCSCodePageEncoding
20284 IBM EBCDIC (西班牙) IBM284 SBCSCodePageEncoding
20285 IBM EBCDIC (UK) IBM285 SBCSCodePageEncoding
20290 IBM EBCDIC (日语片假名) IBM290 SBCSCodePageEncoding
20297 IBM EBCDIC (法国) IBM297 SBCSCodePageEncoding
20420 IBM EBCDIC (阿拉伯语) IBM420 SBCSCodePageEncoding
20423 IBM EBCDIC (希腊语) IBM423 SBCSCodePageEncoding
20424 IBM EBCDIC (希伯来语) IBM424 SBCSCodePageEncoding
20833 IBM EBCDIC (朝鲜语扩展) x-EBCDIC-KoreanExtended SBCSCodePageEncoding
20838 IBM EBCDIC (泰语) IBM-Thai SBCSCodePageEncoding
20866 西里尔字符(KOI8-R) koi8-r SBCSCodePageEncoding
20871 IBM EBCDIC (冰岛语) IBM871 SBCSCodePageEncoding
20880 IBM EBCDIC (西里尔俄语) IBM880 SBCSCodePageEncoding
20905 IBM EBCDIC (土耳其语) IBM905 SBCSCodePageEncoding
20924 IBM 拉丁语 1 IBM00924 SBCSCodePageEncoding
20932 日语(JIS 0208-1990 和 0212-1990) EUC-JP DBCSCodePageEncoding --
20936 简体中文(GB2312-80) x-cp20936 DBCSCodePageEncoding --
20949 朝鲜语 Wansung x-cp20949 DBCSCodePageEncoding --
21025 IBM EBCDIC (西里尔塞尔维亚-保加利亚语) cp1025 SBCSCodePageEncoding
21866 西里尔字符(KOI8-U) koi8-u SBCSCodePageEncoding
28591 西欧字符(ISO) iso-8859-1 Latin1Encoding
28592 中欧字符(ISO) iso-8859-2 SBCSCodePageEncoding
28593 拉丁语 3 (ISO) iso-8859-3 SBCSCodePageEncoding
28594 波罗的海字符(ISO) iso-8859-4 SBCSCodePageEncoding
28595 西里尔字符(ISO) iso-8859-5 SBCSCodePageEncoding
28596 阿拉伯字符(ISO) iso-8859-6 SBCSCodePageEncoding
28597 希腊字符(ISO) iso-8859-7 SBCSCodePageEncoding
28598 希伯来字符(ISO-Visual) iso-8859-8 SBCSCodePageEncoding
28599 土耳其字符(ISO) iso-8859-9 SBCSCodePageEncoding
28603 爱沙尼亚语(ISO) iso-8859-13 SBCSCodePageEncoding
28605 拉丁语 9 (ISO) iso-8859-15 SBCSCodePageEncoding
29001 欧罗巴 x-Europa SBCSCodePageEncoding
38598 希伯来字符(ISO-Logical) iso-8859-8-i SBCSCodePageEncoding
50220 日语(JIS) iso-2022-jp ISO2022Encoding --
50221 日语(JIS-允许 1 字节假名) csISO2022JP ISO2022Encoding --
50222 日语(JIS-允许 1 字节假名 - SO/SI) iso-2022-jp ISO2022Encoding --
50225 朝鲜语(ISO) iso-2022-kr ISO2022Encoding --
50227 简体中文(ISO-2022) x-cp50227 DBCSCodePageEncoding --
51932 日语(EUC) euc-jp EUCJPEncoding --
51936 简体中文(EUC) EUC-CN DBCSCodePageEncoding --
51949 朝鲜语(EUC) euc-kr DBCSCodePageEncoding --
52936 简体中文(HZ) hz-gb-2312 ISO2022Encoding --
54936 简体中文(GB18030) GB18030 GB18030Encoding --
57002 ISCII 梵文 x-iscii-de ISCIIEncoding --
57003 ISCII 孟加拉语 x-iscii-be ISCIIEncoding --
57004 ISCII 泰米尔语 x-iscii-ta ISCIIEncoding --
57005 ISCII 泰卢固语 x-iscii-te ISCIIEncoding --
57006 ISCII 阿萨姆语 x-iscii-as ISCIIEncoding --
57007 ISCII 奥里雅语 x-iscii-or ISCIIEncoding --
57008 ISCII 卡纳达语 x-iscii-ka ISCIIEncoding --
57009 ISCII 马拉雅拉姆语 x-iscii-ma ISCIIEncoding --
57010 ISCII 古吉拉特语 x-iscii-gu ISCIIEncoding --
57011 ISCII 旁遮普语 x-iscii-pa ISCIIEncoding --
65000 Unicode (UTF-7) utf-7 UTF7Encoding --
65001 Unicode (UTF-8) utf-8 UTF8Encoding --

以上是关于所有的字符编码由System.Text.Encoding类获取所有的字符编码如Unicode编码GB18030编码(UTF-8)简体中文(GB2312)的主要内容,如果未能解决你的问题,请参考以下文章

如何将url转换为文件名?

字符编码简介

字符编码的演化

lamp字符编码的转换规则

python-字符编码与文件处理

理清字符集和字符编码关系