python合并多个EXCEL表

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python合并多个EXCEL表相关的知识,希望对你有一定的参考价值。

参考技术A 在日常工作中经常回用到数据分析与统计工作,而在实施数据分析之前,最为最要的就是数据的搜集、整理工作。这里介绍一下多个相同格式的excel合并的处理。如果在excel文件表比较少时,手工合并还可以应付,当几十个几百个甚至更多的表时,手工合并效率会非常低,于是让计算机自动合并处理,帮助我们完成工作就显得非常有必要。

比如,在“2019年集团大学生招聘”下有两个表格,想要实现的是将这两个表格数据合并。

各个表中的数据格式如下图:

结果:

有时候表格存放在文件夹下,现在需要将不同文件夹下的表格合并,此时需要对程序进行简单的修改。

文件目录结构如下:

在此之前需要先了解一下os模块中的walk方法:

结果:

注意:os.walk()方法,它可以查询到目录下不同文件夹中的文件。其中,x代表的是文件路径,y代表的是目录下的文件夹,z代表的是目录下的文件。

结果:

最后,需要注意,以上只是一个简单的程序,对于数据量不是很大的场景,可以放心使用。但当数据量非常大时,程序还需要进一步优化,因为程序是将所有的数据保存在一个列表中,最后再一次性写入excel表中,这里需要考虑excel版本是否支持大数据量的写入,另外,也要考虑程序资源消耗的问题,内存可能不足。

如何将多个excel文件合并?

1、首先将这些excel文件都复制到一个文件夹下。

2、切换到【数据】菜单,点击【新建查询】,选择【从文件】下的【从文件夹】。

3、输入刚刚的文件夹路径,点击【确定】。

4、点击【合并】下的【合并和加载】选项。

5、选择要合并的工作表名称,最后点击【确定】。

6、这就完成了多个excel文件的合并。我们从筛选菜单中可以看到本例中的4个文件都这一份表格中啦。

参考技术A 可以使用 Python 的第三方库 pandas 将多个 excel 文件合并。
首先需要安装 pandas 库,在命令行中输入:
pip install pandas
然后可以使用 pandas 库中的 read_excel 函数读取 excel 文件,使用 concat 函数将多个 DataFrame 数据结构合并,再使用 to_excel 函数将合并后的 DataFrame 保存为新的 excel 文件。
示例代码:
import pandas as pd
# 读取第一个 excel 文件
df1 = pd.read_excel("file1.xlsx")
# 读取第二个 excel 文件
df2 = pd.read_excel("file2.xlsx")
# 将两个文件合并
df = pd.concat([df1, df2])
# 使用 to_excel 函数将合并后的 DataFrame 保存为新的 excel 文件
df.to_excel("merged_file.xlsx")
这样就可以在当前目录下生成一个名为 merged_file.xlsx 的 excel 文件,里面包含了 file1.xlsx 和 file2.xlsx 两个文件的数据。
如果需要合并的文件很多的话,可以使用 for 循环读取文件并进行合并。
合并多个 excel 文件时,如果文件中的表格列不一样,可以使用 merge 或 join 来进行合并,同时需要指定 key 列来进行关联。

以上是关于python合并多个EXCEL表的主要内容,如果未能解决你的问题,请参考以下文章

Python合并多个Excel工作簿

Python合并多个Excel数据

Python实战系列将多个CSV文件合并到Excel的多个sheet

Python读取多个excel文件(删除字段数据格式转换dataframe多表合并)并写入ElasticSearch实战(自动创建索引写入ElasticSearch探索性数据分析)

如何将多个excel文件合并?

合并excel多个工作表