Java 学习笔记 - Apache POI 处理 Excel

Posted 笑虾

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java 学习笔记 - Apache POI 处理 Excel相关的知识,希望对你有一定的参考价值。

Java 学习笔记 - Apache POI 处理 Excel

简介

组件介绍
HSSF对应 03.xls
XSSF对应 07.xlsx
SXSSF对应 07.xlsx,针对大文件读写做了优化

pom.xml

<!--03 的 .xls-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>5.2.2</version>
</dependency>
<!--07 的 .xlsx-->
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.2.2</version>
</dependency>

测试

创建工作薄

拿到个字符串文件路径"E:\\\\temp\\\\测试数据.xls",我到底应该创建哪个对象来操作呢?(扩展名可是能手改的)

HSSFWorkbook sheets1 = new HSSFWorkbook();
XSSFWorkbook sheets2 = new XSSFWorkbook();
SXSSFWorkbook sheets3 = new SXSSFWorkbook();

在网上看到很多根据扩展名 xls , xlsx 进行判断的,或者有些手动去读取文件头判断的。其实 WorkbookFactory.java 提供了工厂方法,自动判断文件头,然后创建工作薄对象。直接调用就行了。这里我用的是密码为null的重载。

Workbook workbook = WorkbookFactory.create(new FileInputStream(path));

最终干活的create方法大概如下这样:
(其中用到的 FileMagic 类 除了判断 excel 还支持很多其他格式,有需要可以拿来)

public static Workbook create(InputStream inp, String password) throws IOException, EncryptedDocumentException 
    // 准备检查魔法(如果流 inp 不支持重复消费,则包一层)
    InputStream is = FileMagic.prepareToCheckMagic(inp);
    // 从流中取第一个字节出来。并 reset 流以便后续可以重头读取。
    byte[] emptyFileCheck = new byte[1];
    is.mark(emptyFileCheck.length); // 标记位置和可消费长度(长度受此参数及缓冲区大小影响)
    if (is.read(emptyFileCheck) < emptyFileCheck.length)  // 如果读取到足 1 字节抛锅
        throw new EmptyFileException();
    
    is.reset(); // 将流重置到上次的标记位置
    // 从流中读取此文件的魔法值(文件类型标识)
    final FileMagic fm = FileMagic.valueOf(is);
    // 如果是 07 版,调用对应 create 创建工作薄对象。
    if (FileMagic.OOXML == fm) 
        return wp(fm, w -> w.create(is));
    
    // 如果 03 版也不是,抛锅,老子不认识这文件。
    if (FileMagic.OLE2 != fm) 
        throw new IOException("Can't open workbook - unsupported file type: "+fm);
    
    // 
    POIFSFileSystem poifs = new POIFSFileSystem(is);
    DirectoryNode root = poifs.getRoot();
    // 这个逻辑不懂。总之是某种特殊情况,再判断一次。
    boolean isOOXML = root.hasEntry(DEFAULT_POIFS_ENTRY) || root.hasEntry(OOXML_PACKAGE);
    // 根据结果创建工作薄
    return wp(isOOXML ? FileMagic.OOXML : fm, w -> w.create(root, password));

遍历:工作薄》工作表》数据行》单元格

import org.apache.poi.ss.usermodel.*;
import org.junit.jupiter.api.Test;
import java.io.FileInputStream;
import java.util.Iterator;

public class ApachePOITest 
    private String path = "E:\\\\测试数据表.xlsx";

    @Test
    public void createWorkbook() throws Exception 
        System.out.println(path);
        
        // 通过【path】文件路径拿到【Workbook】工作薄(会自动判断Excel版本)
        Workbook workbook = WorkbookFactory.create(new FileInputStream(path));
        
        // 取出【Sheet 工作表】迭代器
        Iterator<Sheet> sheetIterator = workbook.sheetIterator();
        // 遍历【Sheet 工作表】
        while (sheetIterator.hasNext())        
            Sheet sheet = sheetIterator.next();
            // 取出【Row 数据行】迭代器
            Iterator<Row> rowIterator = sheet.rowIterator();
            // 遍历【数据行】
            while(rowIterator.hasNext()) 
                Row row = rowIterator.next();
                // 取出【Cell 单元格】迭代器
                Iterator<Cell> cellIterator = row.cellIterator();
                // 遍历【单元格】
                while (cellIterator.hasNext()) 
                    Cell cell = cellIterator.next();
                    // 取出单元格内容并打印
                    System.out.print(getCellValue(cell) + ";\\t\\t");
                
                System.out.println();
            
        
    

    /**
     * 按类型获取单元格值的字符串形式
     * @param cell
     * @return
     */
    private String getCellValue(Cell cell) 
        switch (cell.getCellType()) 
            case BLANK:
                return "空单元格:";
            case FORMULA:
                return "公式:" + cell.getCellFormula();
            case NUMERIC:
                return "数字:" + cell.getNumericCellValue();
            case STRING:
                return "字符串:" + cell.getStringCellValue();
            case BOOLEAN:
                return "布尔值:" + cell.getBooleanCellValue();
            case ERROR:
                return "错误值:" + cell.getErrorCellValue();
            default:
                return "未知类型:" + cell.getCellType();
        
    

参考资料

文档

Apache POI - Javadocs
Apache POI - Component Overview
Apache POI - Component Overview:HSSF、XSSF快速指南

相关封装

Hutool-poi
悟耘开源 / easypoi
Alibaba Easy Excel

教程

以上是关于Java 学习笔记 - Apache POI 处理 Excel的主要内容,如果未能解决你的问题,请参考以下文章

Java库 学习笔记 - POI 在Word文档中查找指定关键字并设置背景色

POI导出excel学习

一脸懵逼学习Java操作Excel之POI(Apache POI)

一脸懵逼学习Java操作Excel之POI(Apache POI)

poi和easyExcel基于Java操作Excel学习笔记

Apache POI学习总结