UTF-8格式txt文件读取字节前三位问题

Posted yxth

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UTF-8格式txt文件读取字节前三位问题相关的知识,希望对你有一定的参考价值。

今天试着读取一份UTF-8格式的txt文件,内容如下

12345

但是每次读取之后转为String类型,输出字符串长度总是为6,并且第一位打印在控制台后不占任何空间。

经过debug查看字节码后发现,在读取文件后的字节流中,前三位的字节分别是

-17,-69,-65

经过查看资料才发现,这是utf-8格式所带的特殊字节。凡是utf-8格式的文件文件,都会有这三个字节。

这种情况会导致对读取后的字符串进行截取时出现问题。

比如读取日期格式时,内容为2018-09-29 00:00:00,而我想要的是2018-09-29,可以通过方法substring转换。

s.substring(0,10)

但是转换出来的结果却是:2018-09-2。

这就是因为三个特殊字节被转换为字符串后占了一行空格。

 

以上是关于UTF-8格式txt文件读取字节前三位问题的主要内容,如果未能解决你的问题,请参考以下文章

java 将编码格式为utf-8的文件内容以 GBK编码存到txt文档

如何从两个文本文件之间的单列中查找前三位匹配模式[关闭]

怎样查看txt文件编码方式

无法以纯文本格式读取文件

文件的扩展操作

java 怎么判断文本内容的编码格式