java java 解压tar.gz读取内容

Posted xwolf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java java 解压tar.gz读取内容相关的知识,希望对你有一定的参考价值。

package com.xwolf.stat.util;

import com.alibaba.druid.util.StringUtils;
import com.alibaba.fastjson.JSON;
import com.google.common.collect.Lists;
import com.google.common.collect.Maps;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.compress.archivers.ArchiveInputStream;
import org.apache.commons.compress.archivers.ArchiveStreamFactory;
import org.apache.commons.compress.archivers.tar.TarArchiveEntry;

import java.io.*;
import java.util.List;
import java.util.Map;
import java.util.zip.GZIPInputStream;

/**
 * tar.gz解压
 * @author xwolf
 * @date 2016-11-07 15:06
 * @since V1.0.0
 */
@Slf4j
public class TarUtil {

    public static final String ENCODING="GBK";
    /**
     * 解压缩tar
     * @param file
     */
    public static String unTarFile(String file) {
        List<Map<String,Object>> lists= Lists.newArrayList();
        try (FileInputStream fis = new FileInputStream(new File(file));
             GZIPInputStream is = new GZIPInputStream(new BufferedInputStream(
                     fis));
             ArchiveInputStream in = new ArchiveStreamFactory().createArchiveInputStream("tar", is);
             InputStreamReader inr = new InputStreamReader(
                     is,ENCODING);//考虑到编码格式
             BufferedReader reader=new BufferedReader(inr)
            ){
            TarArchiveEntry entry = (TarArchiveEntry) in.getNextEntry();
            String lineTxt=null;
            while (entry != null) {
                String name = entry.getName();
                String[] nameSplit=name.split("_");
                String sn=nameSplit[1];
                log.info("name:{},sn:{}",name,sn);
                while((lineTxt = reader.readLine()) != null){
                    String[] keys= lineTxt.split("\\t");
                    Map<String,Object> map = Maps.newHashMap();
                    map.put("sn",sn);
                    for(String key:keys){
                        String[] values =key.split("=");
                        if(!StringUtils.isEmpty(values[0])){
                            map.put(values[0],values[1]);
                        }
                    }
                    lists.add(map);
                }
                entry = (TarArchiveEntry) in.getNextEntry();
            }
           return JSON.toJSONString(lists);
        } catch (Exception e) {
            log.error(e.getMessage(),e);
            return "";
        }
    }
}

  具体的内容读取可忽略,加上了自己的业务需要。

需要的解压缩依赖

 

以上是关于java java 解压tar.gz读取内容的主要内容,如果未能解决你的问题,请参考以下文章

java不解压tar.gz读取包里面的某个文件内容

贴一段java读取hdfs 解压gz zip tar.gz保存到hdfs的代码

java里怎么解压tar.gz文件啊,网上好多例子都不行

java里怎么解压tar.gz文件啊,网上好多例子都不行

如何解压.tar.gz gzip gz 类型文档

如何只查看tar.gz压缩文件中顶层目录的列表