c#导出百万级别数据到Excel速度优化到一分钟之内

Posted 2021-10-25 低代码开发平台

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了c#导出百万级别数据到Excel速度优化到一分钟之内相关的知识，希望对你有一定的参考价值。

如何高效的导出百万级别的数据量到 Excel？

文章目录

- 如何高效的导出百万级别的数据量到 Excel？
传统方式：
- - 代码实现：
其他方式:
结语

如何高效的导出百万级别的数据量到 Excel？

传统方式：

使用基于流的方式进行数据写入，避免将所有数据一次性加载到内存中。可以使用 Apache POI 库中的 SXSSFWorkbook 类，它采用了基于流的方式进行数据写入，可以避免内存溢出的问题，提高写入效率。
将数据分段进行写入，例如每次只写入 1000 条数据，避免一次性写入所有数据。这样可以避免写入效率较低的问题，并减少对内存的占用，提高写入效率。
将数据按列进行写入，而不是按行进行写入。这样可以减少写入数据时需要移动光标的次数，提高写入效率。
避免频繁创建对象和变量。在数据量较大的情况下，创建对象和变量会占用较多的内存，从而降低程序的效率。可以使用对象池和线程池等技术来优化程序的效率。
使用多线程进行数据写入。将数据分段后，可以将不同的线程分别进行数据写入，从而提高写入效率。可以使用 Java 的 Executor 框架来实现多线程的管理和协调。

代码实现：

基于流的方式进行数据写入，可以使用 Apache POI 库中的 SXSSFWorkbook 类，该类采用了基于流的方式进行数据写入，避免将所有数据一次性加载到内存中。下面是一个简单的代码示例，假设需要将数据导出到名为 “test.xlsx” 的 Excel 文件中：

// 创建工作簿对象
SXSSFWorkbook workbook = new SXSSFWorkbook();

// 创建工作表对象
SXSSFSheet sheet = workbook.createSheet("Sheet1");

// 写入表头
Row header = sheet.createRow(0);
header.createCell(0).setCellValue("姓名");
header.createCell(1).setCellValue("年龄");

// 写入数据
for (int i = 0; i < 1000000; i++) 
    Row row = sheet.createRow(i + 1);
    row.createCell(0).setCellValue("张三" + i);
    row.createCell(1).setCellValue(i);


// 写入到文件中
FileOutputStream outputStream = new FileOutputStream("test.xlsx");
workbook.write(outputStream);
outputStream.close();

// 关闭工作簿对象
workbook.close();

其他方式:

在 Java 中，常用的写入 Excel 文件的方式有以下几种：

1. 基于 Apache POI 的方式。

Apache POI 是一个开源的 Java 库，提供了读写 Excel 文件的 API，支持多种文件格式，包括 XLS 和 XLSX 格式。对于百万级别的数据量，可以使用 SXSSFWorkbook 类进行基于流的写入，避免内存溢出的问题。下面是一个使用 Apache POI 的示例代码：

 public static void writeExcel(List<List<Object>> data, String filePath, String sheetName) 
    Workbook workbook = new SXSSFWorkbook();
    Sheet sheet = workbook.createSheet(sheetName);

    int rownum = 0;
    for (List<Object> rowData : data) 
        Row row = sheet.createRow(rownum++);
        int cellnum = 0;
        for (Object obj : rowData) 
            Cell cell = row.createCell(cellnum++);
            if (obj instanceof String) 
                cell.setCellValue((String)obj);
             else if (obj instanceof Integer) 
                cell.setCellValue((Integer)obj);
             else if (obj instanceof Double) 
                cell.setCellValue((Double)obj);
             // 其他类型可以根据需要添加
        
    

    try 
        FileOutputStream out = new FileOutputStream(new File(filePath));
        workbook.write(out);
        out.close();
        workbook.close();
     catch (IOException e) 
        e.printStackTrace();

2. 基于 EasyExcel 的方式。

EasyExcel 是一个基于 Apache POI 封装的 Java 库，提供了更加简单易用的 API，支持读写多种文件格式，包括 XLS、XLSX 和 CSV 格式。对于大规模数据量，EasyExcel 采用了基于流的方式进行数据读写，可以避免内存溢出的问题，同时提供了多线程和异步写入等特性，可以进一步提高程序的效率。下面是一个使用 EasyExcel 的示例代码：

 public static void writeExcel(List<List<Object>> data, String filePath, String sheetName) 
    ExcelWriter excelWriter = EasyExcel.write(filePath).build();
    WriteSheet writeSheet = EasyExcel.writerSheet(sheetName).build();

    int rownum = 0;
    for (List<Object> rowData : data) 
        List<String> rowValues = rowData.stream().map(Object::toString).collect(Collectors.toList());
        excelWriter.write(rowValues, writeSheet);
    

    excelWriter.finish();