java实现 批量转换文件编码格式为UTF8

Posted HkGov

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java实现 批量转换文件编码格式为UTF8相关的知识,希望对你有一定的参考价值。

需要注意点:

建议转换前备份,如果有的项目原本就是UTF-8,执行完成后就会乱码

补救办法是:把项目从UTF-8转换成GBK,不乱码了,但是有后遗症,虽然大部分都救回来了,但是不知道某个字符就变成?了

 

1、首先需要引用java工具包hutool,官网 https://hutool.cn/ 

        <dependency>
            <groupId>cn.hutool</groupId>
            <artifactId>hutool-all</artifactId>
            <version>4.5.6</version>
        </dependency>

2、具体实现

import java.io.File;
import java.io.FileFilter;
import java.nio.charset.Charset;

import cn.hutool.core.io.FileUtil;
import cn.hutool.core.lang.Console;
import cn.hutool.core.util.StrUtil;

public class ConcertEncodeing {

    public static void main(String[] args) {
        
        convertCharset("D:\workspaces\workspaceOxygen\ceshi",Charset.forName("GBK"),Charset.forName("UTF-8"),"java");
        
    }
    
    /**
     * 转换文件编码格式
     * @param path 需要转换的文件或文件夹路径
     * @param fromCharset 原编码格式
     * @param toCharset   目标编码格式
     * @param expansion      需要转换的文件扩展名,如需全部转换则传 null
     */
    private static void convertCharset(String path,Charset fromCharset,Charset toCharset,String expansion ) {
        if (StrUtil.isBlank(path)) {
            return;
        }
        File file = FileUtil.file(path);
        File[] listFiles = file.listFiles(new FileFilter() {
            @Override
            public boolean accept(File pathname) {
                if (StrUtil.isBlank(expansion)) {
                    return true;
                }
                if (FileUtil.isDirectory(pathname)||FileUtil.extName(pathname).equals("java")) {
                    return true;
                }
                return false;
            }
        });
        for (int i = 0; i < listFiles.length; i++) {
            if (listFiles[i].isDirectory()) {
                String canonicalPath = FileUtil.getCanonicalPath(listFiles[i]);
                //每个文件夹分个线程处理,提高点儿效率
                new Thread(new Runnable() {
                    @Override
                    public void run() {
                        convertCharset(canonicalPath,fromCharset,toCharset,expansion);
                    }
                }).start();
            }else {
                FileUtil.convertCharset(listFiles[i], fromCharset,  toCharset);
                Console.log("转换完成文件名:{}",listFiles[i].getName());
            }
        }
    }
}

 

以上是关于java实现 批量转换文件编码格式为UTF8的主要内容,如果未能解决你的问题,请参考以下文章

Notepad++ 使用Python 插件批量 转换文本文件(字幕文件) 为 UTF8

如何使用Java代码将GBK编码格式的工程转换为UTF-8编码格式的工程

有没有一种软件可以批量把TXT文件转换为UTF8编码的

批量将ANSI文本txt文件转换成UTF8编码格式 (vbs方法)

批量更改文件编码格式 utf8到gb2312

如何批量转换文本文档编码