首页 > 其他 > 详细

UTF-8格式txt文件读取字节前三位问题

时间:2018-09-29 18:41:49      阅读:143      评论:0      收藏:0      [点我收藏+]

今天试着读取一份UTF-8格式的txt文件,内容如下

12345

但是每次读取之后转为String类型,输出字符串长度总是为6,并且第一位打印在控制台后不占任何空间。

经过debug查看字节码后发现,在读取文件后的字节流中,前三位的字节分别是

-17,-69,-65

经过查看资料才发现,这是utf-8格式所带的特殊字节。凡是utf-8格式的文件文件,都会有这三个字节。

这种情况会导致对读取后的字符串进行截取时出现问题。

比如读取日期格式时,内容为2018-09-29 00:00:00,而我想要的是2018-09-29,可以通过方法substring转换。

s.substring(0,10)

但是转换出来的结果却是:2018-09-2。

这就是因为三个特殊字节被转换为字符串后占了一行空格。

 

UTF-8格式txt文件读取字节前三位问题

原文:https://www.cnblogs.com/yxth/p/9725157.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!