怎么解决读取txt文件读取时中文乱码问题
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么解决读取txt文件读取时中文乱码问题相关的知识,希望对你有一定的参考价值。
从SDCard保存的txt文件读取中文到android系统中会出现乱码问题,如何解决这个乱码问题,网上有不少解答方法,譬如说利用String temp1 =EncodingUtils.getString(strLine.getBytes(),"GB2312"); 但并非对所有的情况都适用,解决乱码问题首先要明白为什么会乱码。究其原因,是因为txt文件在win系统上保存时默认为ANSI格式,而android目前只支持UTF-8编码,因此将txt文件的中文读入android系统中会产生乱码。也有人说直接将txt另存为UTF-8编码格式来解决乱码问题,但这种方法指标不治本,不能要求用户手动去更改格式,客户第一嘛。因此还是需要想办法在程序中进行处理。以下做了一些编码格式的测试:
测试文本: 122.11196,29.90573,北仑固废厂 测试代码段:
reader=new BufferedReader(new FileReader(filename));
strLine=reader.readLine() ;
String temp1 = EncodingUtils.getString(strLine.getBytes(),"GB2312");
String temp2 = EncodingUtils.getString(strLine.getBytes("utf-8"),"utf-8");
String temp3 = EncodingUtils.getString(strLine.getBytes(),"utf-8");
将文件存成 Unicode 格式
这种方式能得到非乱码的中文显示,但对于 utf-8 格式下取得的经纬度数字利用double lon = Double.parseDouble(lat); 报错 NumberFormatException,原因可能是 parseDouble(lat)方法不能处理存成utf-8格式的带标点小数。 将文件 存成 ANSI 格式
将代码改为:
reader = new BufferedReader(new InputStreamReader(new FileInputStream(filename),"GB2312"));
strLine=reader.readLine() ;
String temp1 = EncodingUtils.getString(strLine.getBytes(),"GB2312");
String temp2 = EncodingUtils.getString(strLine.getBytes("utf-8"),"utf-8");
String temp3 = EncodingUtils.getString(strLine.getBytes(),"utf-8");
即解决了中文乱码问题,又解决了Double.parseDouble(lat)报错问题。 参考技术A 又是你啊,上午已经回答了你一个问题了。你的编码格式设置下就可以了。import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.InputStreamReader;import java.io.RandomAccessFile;public class Random public static void main(String[] args) throws Exception int lineCount = 0; File f = new File("E:\\数学3班.txt"); RandomAccessFile raf = new RandomAccessFile(f, "r"); java.util.Random r1 = new java.util.Random(); BufferedReader buffer = new BufferedReader(new InputStreamReader( new FileInputStream(f))); while (buffer.readLine() != null) lineCount++; int a = r1.nextInt(lineCount); int i = 0; while (raf.readLine() != null) i++; if (i == a) String temp = raf.readLine(); System.out .println(new String(temp.getBytes("iso8859-1"), "GBK")); 参考技术B
TXT文件另存,更改编码格式为ANSI
Java笔记-解决读取文件时中文乱码问题(InputStreamReader设置编码)
Java一般读取文件时使用如下代码:
InputStream inputStream = this.getClass().getClassLoader().getResourceAsStream("xxx");
BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream);
while(reader.ready())
String line = reader.readLine();
System.out.println(line);
reader.close();
inputStream.close();
有时,这个文件是utf-8的,Java默认是能读的,有的是GBK的,可以用InputStreamReader设置编码
InputStream inputStream = this.getClass().getClassLoader().getResourceAsStream("xxx");
BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream, "gbk");
while(reader.ready())
String line = reader.readLine();
System.out.println(line);
reader.close();
inputStream.close();
以上是关于怎么解决读取txt文件读取时中文乱码问题的主要内容,如果未能解决你的问题,请参考以下文章