UTF-8格式txt文件读取字节前三位问题

Posted 2021-01-09 yxth

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了UTF-8格式txt文件读取字节前三位问题相关的知识，希望对你有一定的参考价值。

今天试着读取一份UTF-8格式的txt文件，内容如下

但是每次读取之后转为String类型，输出字符串长度总是为6，并且第一位打印在控制台后不占任何空间。

经过debug查看字节码后发现，在读取文件后的字节流中，前三位的字节分别是

-17,-69,-65

经过查看资料才发现，这是utf-8格式所带的特殊字节。凡是utf-8格式的文件文件，都会有这三个字节。

这种情况会导致对读取后的字符串进行截取时出现问题。

比如读取日期格式时，内容为2018-09-29 00:00:00，而我想要的是2018-09-29，可以通过方法substring转换。

s.substring(0,10)

但是转换出来的结果却是：2018-09-2。

这就是因为三个特殊字节被转换为字符串后占了一行空格。

以上是关于UTF-8格式txt文件读取字节前三位问题的主要内容，如果未能解决你的问题，请参考以下文章