pandas vs pyexcelerate 写入excel大文件比较

Posted HuaBro

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas vs pyexcelerate 写入excel大文件比较相关的知识,希望对你有一定的参考价值。

工作中需要大量excel读写,数据大小接近200M,传统excel略显吃力,

无论是数据处理还是读取,很容易因为操作过快导致程序崩掉,如果忘了保存,那将是很头疼的事。

pandas除了读取和存储较慢,数据处理和查询都比较出色,下面就写入excel,对比pyexcelerate ,看看各自优势。

 

 

 

 

数据质量

 

 

 

通过对比:

        1、从时间看:pandas处理10m20s,pyexcelerate处理5m46s,pyexcelerate速度完胜,节省几乎一半时间。

         2、从存储文件大小看:pandas:173M,pyexcelerate:228M,pandas完胜,内存节省55M

         3、从数据质量看,pandas空数据NA,excel显示正常,pyexcelerate空数据,无论数值型还是文本型,均显示#NUM!,pandas完胜。

 

结论:

pandas大数据存储比较快,但是数据质量可靠,文件小;

pyexcelerate存储比较快,但是数据质量不佳,需要二次处理(excel再做处理,批量替换#NUM!不如用pandas),文件也比较大小

目前看来,pandas还是很稳妥,除了读写excel大文件比较慢,处理数据还是很快的。

【#NUM!:此错误表明公式或函数中含有无效的数值】

 

------------------------------- ********厚德达理,励志勤工******** -------------------------------

以上是关于pandas vs pyexcelerate 写入excel大文件比较的主要内容,如果未能解决你的问题,请参考以下文章

python可以处理excel数据吗

怎么使用python将一组数据写入excel

pandas_udf结果无法写入表

pandas读取和写入excel,csv太慢怎么办

pandas读取和写入excel,csv太慢怎么办

ModuleNotFoundError:vs 代码中没有名为“pandas”的模块