java读取配置文件(properties)的时候,unicode码转utf-8
Posted edgedance
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java读取配置文件(properties)的时候,unicode码转utf-8相关的知识,希望对你有一定的参考价值。
有时我们在读取properties结尾的配置文件的时候,如果配置文件中有中文,那么我们读取到的是unicode码的中文,需要我们在转换一下,代码如下
/**
* 将配置文件中的Unicode 转 utf-8 汉字
* @param 原始字符串
* @return 转换后的格式的字符串
*/
public static String unicodeToChina(String str) {
Charset set = Charset.forName("UTF-16");
Pattern p = Pattern.compile("\\\\u([0-9a-fA-F]{4})");
Matcher m = p.matcher( str );
int start = 0 ;
int start2 = 0 ;
StringBuffer sb = new StringBuffer();
while( m.find( start ) ) {
start2 = m.start() ;
if( start2 > start ){
String seg = str.substring(start, start2) ;
sb.append( seg );
}
String code = m.group( 1 );
int i = Integer.valueOf( code , 16 );
byte[] bb = new byte[ 4 ] ;
bb[ 0 ] = (byte) ((i >> 8) & 0xFF );
bb[ 1 ] = (byte) ( i & 0xFF ) ;
ByteBuffer b = ByteBuffer.wrap(bb);
sb.append( String.valueOf( set.decode(b) ).trim() );
start = m.end() ;
}
start2 = str.length() ;
if( start2 > start ){
String seg = str.substring(start, start2) ;
sb.append( seg );
}
return sb.toString() ;
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
public static void main(String[] args) {
String str = unicodeToChina("\u672a\u6765");
System.out.println(str);
}
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
结果:未来
以上是关于java读取配置文件(properties)的时候,unicode码转utf-8的主要内容,如果未能解决你的问题,请参考以下文章