将字符串向hdfs中写入,出现中文乱码!

Posted xavier-xd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将字符串向hdfs中写入,出现中文乱码!相关的知识,希望对你有一定的参考价值。

 

jsonObject.toString():需要处理的json对象转成的字符串
"/testData/ExtractKWByOnce.txt":写入hdfs中的目标路径
try {
            Configuration configuration=new Configuration();
            InputStream inputStream=new BufferedInputStream(
                    new ByteArrayInputStream(jsonObject.toString().getBytes("")) );//打开一个BufferedInputStream字节输入流

            FileSystem fs=FileSystem.get(URI.create("hdfs://localtion:8020"),configuration);
//这里是creat()方法表示新创建一个文件,如果想在一个文件上追加,请用append()方法。 FSDataOutputStream fsDataOutputStream=fs.create(new Path("/testData/ExtractKWByOnce.txt")); IOUtils.copyBytes(inputStream,fsDataOutputStream,1024,true); fsDataOutputStream.close(); fs.close(); inputStream.close(); } catch (IOException e) { e.printStackTrace(); }

用此方法可能会出现 中文乱码问题,hdfs上的文件和自己期待存入的内容有差异。

可以在 jsonObject.toString().getBytes("") 处将我们的编码格式指定为:

jsonObject.toString().getBytes("GBK")

基本可以解决问题

以上是关于将字符串向hdfs中写入,出现中文乱码!的主要内容,如果未能解决你的问题,请参考以下文章

hive客户端表字段查询中文乱码该怎么解决?

怎样将数据库数据写入到hdfs中

python用xlwt向xls中写入中文,显示乱码该怎么解决

解决FileOutputStream中文乱码问题

c语言,数据能写入文件,但是从文件读取数据的时候,出现了乱码,如下代码,求解答

java写入mysql数据库乱码