java程序实现Unicode码和中文互相转换

Posted Leoxlu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java程序实现Unicode码和中文互相转换相关的知识,希望对你有一定的参考价值。

 

根据前一篇的补充问题http://blog.csdn.net/fancylovejava/article/details/10142391

有了前一篇文章的了解,大概了解了unicode编码格式了

ANSI:汉字区的内码范围高字节从B0-F7,低字节从A1-FE
Unicode:汉字的Unicode编码范围为\u4E00-\u9FA5 \uF900-\uFA2D,如果不在这个范围内就不是汉字了.

现在程序中遇到的问题是,服务器端发送中文给Android客户端的时候,android客户端获取到字符串然后显示到界面上,可是显示的结果是

unicode编码格式开始兑奖所以呢,这要转换啊

 

有相关的网站工具转换unicode编码和asicc编码,http://tool.chinaz.com/Tools/Unicode.aspx

 

jdk有一个工具也提供转换,是native2ascii.exe,在bin目录下面,直接点开输入中文就可以了

有篇比较好的文章介绍http://sailinglee.iteye.com/blog/430568

 

可是我们要在程序中将这个些开转换成中文啊~~~~

String a="开始兑奖";
 System.out.println(a.codePointAt(0));

这个打印出来的是“开”字的开unicode码的数字部分24320

 

System.out.println((char)24320);

这个打印出来的是将一个数字转换成一个char类型,这个char类型就是一个代表这个unicode码的中文字符,

打印出来结果为:开

有了这个就可以将unicode转换成中文了

 

还有篇文章很好,转过来http://blog.csdn.net/ocean20/article/details/6743385说明下char这个字符型在Java

java中的char占几个字节

 

1:“字节”是byte,“位”是bit ;

  2: 1 byte = 8 bit ;

  char 在java中是2个字节。java采用unicode,2个字节(16位)来表示一个字符。

  例子代码如下:

 

 

[java] view plaincopy
 
 
  1. public class Test {  
  2.   
  3.   
  4.     public static void main(String[] args) {  
  5.         String str= "中";  
  6.         char x =‘中‘;  
  7.         byte[] bytes=null;  
  8.         byte[] bytes1=null;  
  9.         try {  
  10.             bytes = str.getBytes("utf-8");  
  11.             bytes1 = charToByte(x);  
  12.         } catch (UnsupportedEncodingException e) {  
  13.             // TODO Auto-generated catch block  
  14.             e.printStackTrace();  
  15.         }  
  16.         System.out.println("bytes 大小:"+bytes.length);  
  17.         System.out.println("bytes1大小:"+bytes1.length);  
  18.     }  
  19.     public static byte[] charToByte(char c) {   
  20.         byte[] b = new byte[2];   
  21.         b[0] = (byte) ((c & 0xFF00) >> 8);   
  22.         b[1] = (byte) (c & 0xFF);   
  23.         return b;   
  24.     }  
  25. }  

 

运行结果:

bytes 大小:3
bytes1大小:2

  

java是用unicode来表示字符,"中"这个中文字符的unicode就是2个字节。

 String.getBytes(encoding)方法是获取指定编码的byte数组表示,

通常gbk/gb2312是2个字节,utf-8是3个字节

如果不指定encoding则取系统默认的encoding。

以上是关于java程序实现Unicode码和中文互相转换的主要内容,如果未能解决你的问题,请参考以下文章

字符与编码(Java编码转换详细过程)

8421BCD码和十进制数互相转换 (100101111000)8421BCD (19.7)10

js怎么将unicode编码转换成ascii码

实战Java高并发程序设计 7让线程之间互相帮助--SynchronousQueue的实现

C#字符串与unicode互相转换

JAXB XML和Bean互相转换