Java 学习笔记 - Apache POI 处理 Excel
Posted 笑虾
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java 学习笔记 - Apache POI 处理 Excel相关的知识,希望对你有一定的参考价值。
Java 学习笔记 - Apache POI 处理 Excel
简介
组件 | 介绍 |
---|---|
HSSF | 对应 03 版 .xls |
XSSF | 对应 07 版 .xlsx |
SXSSF | 对应 07 版 .xlsx ,针对大文件读写做了优化 |
pom.xml
<!--03 的 .xls-->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.2.2</version>
</dependency>
<!--07 的 .xlsx-->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.2</version>
</dependency>
测试
创建工作薄
拿到个字符串文件路径"E:\\\\temp\\\\测试数据.xls"
,我到底应该创建哪个对象来操作呢?(扩展名可是能手改的)
HSSFWorkbook sheets1 = new HSSFWorkbook();
XSSFWorkbook sheets2 = new XSSFWorkbook();
SXSSFWorkbook sheets3 = new SXSSFWorkbook();
在网上看到很多根据扩展名 xls
, xlsx
进行判断的,或者有些手动去读取文件头判断的。其实 WorkbookFactory.java 提供了工厂方法,自动判断文件头
,然后创建工作薄对象。直接调用就行了。这里我用的是密码为null
的重载。
Workbook workbook = WorkbookFactory.create(new FileInputStream(path));
最终干活的create
方法大概如下这样:
(其中用到的 FileMagic 类 除了判断 excel
还支持很多其他格式,有需要可以拿来
)
public static Workbook create(InputStream inp, String password) throws IOException, EncryptedDocumentException
// 准备检查魔法(如果流 inp 不支持重复消费,则包一层)
InputStream is = FileMagic.prepareToCheckMagic(inp);
// 从流中取第一个字节出来。并 reset 流以便后续可以重头读取。
byte[] emptyFileCheck = new byte[1];
is.mark(emptyFileCheck.length); // 标记位置和可消费长度(长度受此参数及缓冲区大小影响)
if (is.read(emptyFileCheck) < emptyFileCheck.length) // 如果读取到足 1 字节抛锅
throw new EmptyFileException();
is.reset(); // 将流重置到上次的标记位置
// 从流中读取此文件的魔法值(文件类型标识)
final FileMagic fm = FileMagic.valueOf(is);
// 如果是 07 版,调用对应 create 创建工作薄对象。
if (FileMagic.OOXML == fm)
return wp(fm, w -> w.create(is));
// 如果 03 版也不是,抛锅,老子不认识这文件。
if (FileMagic.OLE2 != fm)
throw new IOException("Can't open workbook - unsupported file type: "+fm);
//
POIFSFileSystem poifs = new POIFSFileSystem(is);
DirectoryNode root = poifs.getRoot();
// 这个逻辑不懂。总之是某种特殊情况,再判断一次。
boolean isOOXML = root.hasEntry(DEFAULT_POIFS_ENTRY) || root.hasEntry(OOXML_PACKAGE);
// 根据结果创建工作薄
return wp(isOOXML ? FileMagic.OOXML : fm, w -> w.create(root, password));
遍历:工作薄》工作表》数据行》单元格
import org.apache.poi.ss.usermodel.*;
import org.junit.jupiter.api.Test;
import java.io.FileInputStream;
import java.util.Iterator;
public class ApachePOITest
private String path = "E:\\\\测试数据表.xlsx";
@Test
public void createWorkbook() throws Exception
System.out.println(path);
// 通过【path】文件路径拿到【Workbook】工作薄(会自动判断Excel版本)
Workbook workbook = WorkbookFactory.create(new FileInputStream(path));
// 取出【Sheet 工作表】迭代器
Iterator<Sheet> sheetIterator = workbook.sheetIterator();
// 遍历【Sheet 工作表】
while (sheetIterator.hasNext())
Sheet sheet = sheetIterator.next();
// 取出【Row 数据行】迭代器
Iterator<Row> rowIterator = sheet.rowIterator();
// 遍历【数据行】
while(rowIterator.hasNext())
Row row = rowIterator.next();
// 取出【Cell 单元格】迭代器
Iterator<Cell> cellIterator = row.cellIterator();
// 遍历【单元格】
while (cellIterator.hasNext())
Cell cell = cellIterator.next();
// 取出单元格内容并打印
System.out.print(getCellValue(cell) + ";\\t\\t");
System.out.println();
/**
* 按类型获取单元格值的字符串形式
* @param cell
* @return
*/
private String getCellValue(Cell cell)
switch (cell.getCellType())
case BLANK:
return "空单元格:";
case FORMULA:
return "公式:" + cell.getCellFormula();
case NUMERIC:
return "数字:" + cell.getNumericCellValue();
case STRING:
return "字符串:" + cell.getStringCellValue();
case BOOLEAN:
return "布尔值:" + cell.getBooleanCellValue();
case ERROR:
return "错误值:" + cell.getErrorCellValue();
default:
return "未知类型:" + cell.getCellType();
参考资料
文档
Apache POI - Javadocs
Apache POI - Component Overview
Apache POI - Component Overview:HSSF、XSSF快速指南
相关封装
Hutool-poi
悟耘开源 / easypoi
Alibaba Easy Excel
教程
- 英文教程
JavatPoint:Apache POI Tutorial
SimpleSolution:Java Apache POI Tutorial
stackoverflow:Apache POI Excel How To … - 中文教程
cnblogs - 技术江湖 - Apache POI使用详解
CSDN - 技术宅星云 - Apache POI 中文使用指南 - 视频教程
B站 -【狂神说Java】POI及EasyExcel一小时搞定通俗易懂
以上是关于Java 学习笔记 - Apache POI 处理 Excel的主要内容,如果未能解决你的问题,请参考以下文章
Java库 学习笔记 - POI 在Word文档中查找指定关键字并设置背景色
一脸懵逼学习Java操作Excel之POI(Apache POI)
一脸懵逼学习Java操作Excel之POI(Apache POI)