Java解压缩.zip.tar.gz.tar.bz2(支持中文)

Posted morethink

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java解压缩.zip.tar.gz.tar.bz2(支持中文)相关的知识,希望对你有一定的参考价值。

本文介绍Java解压缩.zip、.tar.gz、.tar.bz2的方式。

  1. 对于zip文件:使用java.util.zip.ZipEntryjava.util.zip.ZipFile,通过设置Charset为StandardCharsets.UTF_8支持中文。
  2. 对于.tar.gz、tgz文件:可以看做先用tar打包,再使用gz进行压缩。使用commons-compress包的TarArchiveInputStreamGzipCompressorInputStream
  3. 对于.tar.bz2文件:可以看做先用tar打包,再使用bz2进行压缩。使用commons-compress包的TarArchiveInputStreamBZip2CompressorInputStream

在这里有个问题如果使用TarInputStream搭配jdk的 GZIPInputStream会产生乱码。而使用commons-compress包的TarArchiveInputStreamGzipCompressorInputStream则可解决乱码问题。

代码如下:

public class ZipUtil {

    private static final Logger LOG = LoggerFactory.getLogger(ZipUtil.class);

    private static final int BUFFER_SIZE = 1024 * 100;

    private ZipUtil() {
    }

    public static boolean decompress(String filePath, String outputDir, boolean isDeleted) {
        File file = new File(filePath);
        if (!file.exists()) {
            LOG.error("decompress file not exist.");
            return false;
        }
        try {
            if (filePath.endsWith(".zip")) {
                unZip(file, outputDir);
            }
            if (filePath.endsWith(".tar.gz") || filePath.endsWith(".tgz")) {
                decompressTarGz(file, outputDir);
            }
            if (filePath.endsWith(".tar.bz2")) {
                decompressTarBz2(file, outputDir);
            }
            filterFile(new File(outputDir));
            if (isDeleted) {
                FileUtils.deleteQuietly(file);
            }
            return true;
        } catch (IOException e) {
            LOG.error("decompress occur error.");
        }
        return false;
    }

    /**
     * 解压 .zip 文件
     *
     * @param file      要解压的zip文件对象
     * @param outputDir 要解压到某个指定的目录下
     * @throws IOException
     */
    public static void unZip(File file, String outputDir) throws IOException {
        try (ZipFile zipFile = new ZipFile(file, StandardCharsets.UTF_8)) {
            //创建输出目录
            createDirectory(outputDir, null);
            Enumeration<?> enums = zipFile.entries();
            while (enums.hasMoreElements()) {
                ZipEntry entry = (ZipEntry) enums.nextElement();
                if (entry.isDirectory()) {
                    //创建空目录
                    createDirectory(outputDir, entry.getName());
                } else {
                    try (InputStream in = zipFile.getInputStream(entry)) {
                        try (OutputStream out = new FileOutputStream(
                                new File(outputDir + File.separator + entry.getName()))){
                            writeFile(in, out);
                        }
                    }
                }
            }
        }
    }

    public static void decompressTarGz(File file, String outputDir) throws IOException {
        try (TarArchiveInputStream tarIn = new TarArchiveInputStream(
                new GzipCompressorInputStream(
                        new BufferedInputStream(
                                new FileInputStream(file))))) {
            //创建输出目录
            createDirectory(outputDir, null);
            TarArchiveEntry entry = null;
            while ((entry = tarIn.getNextTarEntry()) != null) {
                //是目录
                if (entry.isDirectory()) {
                    //创建空目录
                    createDirectory(outputDir, entry.getName());
                } else {
                    //是文件
                    try (OutputStream out = new FileOutputStream(
                            new File(outputDir + File.separator + entry.getName()))) {
                        writeFile(tarIn, out);
                    }
                }
            }
        }

    }

    /**
     * 解压缩tar.bz2文件
     *
     * @param file      压缩包文件
     * @param outputDir 目标文件夹
     */
    public static void decompressTarBz2(File file, String outputDir) throws IOException {
        try (TarArchiveInputStream tarIn =
                     new TarArchiveInputStream(
                             new BZip2CompressorInputStream(
                                     new FileInputStream(file)))) {
            createDirectory(outputDir, null);
            TarArchiveEntry entry;
            while ((entry = tarIn.getNextTarEntry()) != null) {
                if (entry.isDirectory()) {
                    createDirectory(outputDir, entry.getName());
                } else {
                    try (OutputStream out = new FileOutputStream(
                            new File(outputDir + File.separator + entry.getName()))) {
                        writeFile(tarIn, out);
                    }
                }
            }
        }
    }

    /**
     * 写文件
     *
     * @param in
     * @param out
     * @throws IOException
     */
    public static void writeFile(InputStream in, OutputStream out) throws IOException {
        int length;
        byte[] b = new byte[BUFFER_SIZE];
        while ((length = in.read(b)) != -1) {
            out.write(b, 0, length);
        }
    }

    /**
     * 创建目录
     *
     * @param outputDir
     * @param subDir
     */
    public static void createDirectory(String outputDir, String subDir) {
        File file = new File(outputDir);
        //子目录不为空
        if (!(subDir == null || subDir.trim().equals(""))) {
            file = new File(outputDir + File.separator + subDir);
        }
        if (!file.exists()) {
            if (!file.getParentFile().exists()) {
                file.getParentFile().mkdirs();
            }
            file.mkdirs();
        }
    }

    /**
     * 删除Mac压缩再解压产生的 __MACOSX 文件夹和 .开头的其他文件
     *
     * @param filteredFile
     */
    public static void filterFile(File filteredFile) {
        if (filteredFile != null) {
            File[] files = filteredFile.listFiles();
            for (File file : files) {
                if (file.getName().startsWith(".") ||
                        (file.isDirectory() && file.getName().equals("__MACOSX"))) {
                    FileUtils.deleteQuietly(file);
                }
            }
        }
    }
}

代码地址

参考文档

  1. commons-compress官方实例

以上是关于Java解压缩.zip.tar.gz.tar.bz2(支持中文)的主要内容,如果未能解决你的问题,请参考以下文章

Maven Assembly插件打包包含依赖项配置

Maven Assembly插件打包包含依赖项配置

Java压缩与解压缩问题

安装java解压缩核心文件失败怎么办

搭建Java环境如何解压缩

Java - 读取 BZ2 文件并即时解压缩/解析