使用spreadsheet-reader流式读取超大excel文件

Posted lynwood

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用spreadsheet-reader流式读取超大excel文件相关的知识,希望对你有一定的参考价值。

github:https://github.com/nuovo/spreadsheet-reader

最近有一个读取超大excel文件的功能需求,使用的phpexcel,有严重的内存泄露问题,暂时还未找到解决方案。

spreadsheet-reader是流式读取excel的,对于大多数格式的excel都能正常的读取,且内存消耗很小。

 

PS:其中遇到的坑

xlsx文件一定要标准,也就是必须是offce生成的,而不是wps之类的……被这个坑了很久

如果不正确会出现如下报错,个人猜测是文件头问题,建议用office打开另存为一份就没问题了

 

Warning: XMLReader::open(): Empty string supplied as input in C:myphp_wwwPHPTutorialWWWspreadsheet-reader-masterSpreadsheetReader_XLSX.php on line 959

Warning: XMLReader::read(): Load Data before trying to read in C:myphp_wwwPHPTutorialWWWspreadsheet-reader-masterSpreadsheetReader_XLSX.php on line 995

Notice: Undefined variable: i in C:myphp_wwwPHPTutorialWWW est.php on line 10
Array ( ) 
Warning: XMLReader::read(): Load Data before trying to read in C:myphp_wwwPHPTutorialWWWspreadsheet-reader-masterSpreadsheetReader_XLSX.php on line 995







以上是关于使用spreadsheet-reader流式读取超大excel文件的主要内容,如果未能解决你的问题,请参考以下文章

jq超简单的流式布局,代码简单,容易修改

使用火花流从数据库流式读取

Apache Spark 无法读取使用流式作业编写的 parquet 文件夹

当 AMQ 主题中没有数据可读取时如何停止流式传输

C错误从流式套接字读取数据包

如何从本地目录中读取,kmeans 流式传输 pyspark