java怎么把utf-8的字符串转换为gb2312格式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java怎么把utf-8的字符串转换为gb2312格式相关的知识,希望对你有一定的参考价值。

Java中字符串转码,根据实际运用的环境有以下三种方式

1、使用Java.lang.String

这是最常用的方法,先用对应编码获取字节,然后重新构造新编码,示例代码如下:

String s = "清山";  
byte[] b = s.getBytes("utf-8");//编码  
String sa = new String(b, "gb2312");//解码:用什么字符集编码就用什么字符集解码

2、java.io.InputStreamReader/OutputStreamWriter:桥转换

读写文件的应用中,可以使用这种方式,直接在IO流构造中转换,示例代码如下:

InputStream is = new FileInputStream("C:/项目进度跟踪.txt");//文件读取  
InputStreamReader isr = new InputStreamReader(is, "utf-8");//解码  
OutputStream os = new FileOutputStream("C:/项目进度跟踪_gb2312.txt");//文件输出  
OutputStreamWriter osw = new OutputStreamWriter(os, "gb2312");//开始编码

3、java.nio.Charset

使用nio中的Charset转换字符,示例代码如下:

Charset inSet = Charset.forName("utf-8");  // 解码字符集 
Charset outSet = Charset.forName("gb2312");  // 编码字符集  
CharsetDecoder de = inSet.newDecoder();  // 解码器
CharsetEncoder en = outSet.newEncoder();// 编码

参考技术A new String("adff","gb2312");

python怎么知道一个字符串的编码方式

字符串的编码,有很多种如utf-8,gb2312,gbk,gb18030,bz2,zlib,big5,bzse64

python 对编码的处理有两个方法,decode()和 encode()方法

a = '你好'
b = 'python'
print a.decode('utf-8').encode('gbk')##decode方法把字符串转换为unicode对象,然后通过encode方法转换为指定的编码字符串对象
print b.decode('utf-8')##decode方法把字符串转换为unicode对象

所以要让python(或者说机器)来识别字符串的编码,是一件很困难的事。编码就是汉字和整数之间的对应,同一个整数,可以在不同的编码中,都有对应的汉字。比如下面的例子,比特流'\\xe6\\xb0\\xb4\\xe5\\xa3\\xb6'在四种编码中都有对应的汉字,但只有在utf-8编码下,它对应的汉字才有意义。我们可以一眼看出这点,可是要让计算机做到这点,就很难了。

>>> s = '水壶'
>>> s
18: '\\xe6\\xb0\\xb4\\xe5\\xa3\\xb6'
>>> print unicode(s, 'big5')
瘗游ㄥ
>>> print unicode(s, 'gbk')
姘村6
>>> print unicode(s, 'gb2312')
姘村6
>>> print unicode(s, 'utf-8')
水壶

参考技术A 安装chardet模块
chardet文件夹放在/usr/lib/python2.4/site-packages目录下

[root@sha-sso-data01 chardet]# python
Python 2.4.3 (#1, Sep 21 2011, 19:55:41)
[GCC 4.1.2 20080704 (Red Hat 4.1.2-51)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import chardet
>>> chardet.detect("我")
'confidence': 0.505, 'encoding': 'utf-8'
>>>

以上是关于java怎么把utf-8的字符串转换为gb2312格式的主要内容,如果未能解决你的问题,请参考以下文章

如何把utf-8编码的转换为gb2312

怎样把utf-8编码网页 转换为gb2312

python怎么把ASNI(GB2312)转换成UTF-8

怎么把utf-8格式的文件转为gb2312

Java怎么将字符串转换为GB2312原编码

怎么才能把utf-8编码的asp文件转换成gn2312