使用 pandas 读取和更新 XLSM 文件中的工作表,同时保留 VBA 代码

Posted

技术标签:

【中文标题】使用 pandas 读取和更新 XLSM 文件中的工作表,同时保留 VBA 代码【英文标题】:Reading and updating sheets in an XLSM file using pandas while preserving the VBA code 【发布时间】:2019-08-03 15:59:26 【问题描述】:

我需要读取一个 xlsm 文件并更新文件中的一些工作表。我想为此目的使用 pandas。

我尝试了以下帖子中提供的答案。当我重新添加 VBA 项目时,我看不到 VBA 宏。https://***.com/posts/28170939/revisions

这是我尝试过的步骤,

从original.xlsm文件中提取VBA_project.bin然后

writer = pd.ExcelWriter('original.xlsx', engine='xlsxwriter')
workbook = writer.book
workbook.filename = 'test.xlsm'
workbook.add_vba_project('vbaProject.bin')
writer.save()

我没有看到附加到“test.xlsm”的 VBA 宏。即使我将它写入“original.xlsm”文件,结果也是一样的。

如何保留 VBA 宏或将它们添加回原始 xlsm 文件?

另外,有没有办法我可以使用pd.ExcelWriter 打开“xlsm”文件本身而不是“xlsx”对应文件?

【问题讨论】:

我认为您应该为此使用 VBA,而不是 Python。只是我的 .02。 文件很大,目的是将原始文件的一个特定工作表合并到最近的更新中,例如将本月的数据集添加到每年累积的数据表中。 【参考方案1】:

你可以用 pandas 轻松做到这一点

import pandas as pd
import xlrd

# YOU MUST PUT sheet_name=None TO READ ALL CSV FILES IN YOUR XLSM FILE
df = pd.read_excel('YourFile.xlsm', sheet_name=None)

# prints all sheets
print(df)

【讨论】:

【参考方案2】:

啊,我明白了。我仍然不知道你在做什么,但这里有一些让 Python 与 Excel 通信的通用代码示例。

Read contents of a worksheet in Excel:

import pandas as pd
from pandas import ExcelWriter
from pandas import ExcelFile

df = pd.read_excel('C:\\your_path\\test.xls', sheetname='Sheet1')

************************************************************************************

Use Python to run Macros in Excel:
import os
import win32com.client

#Launch Excel and Open Wrkbook
xl=win32com.client.Dispatch("Excel.Application")  
xl.Workbooks.Open(Filename="C:\your_path\excelsheet.xlsm") #opens workbook in readonly mode. 

#Run Macro
xl.Application.Run("excelsheet.xlsm!modulename.macroname") 

#Save Document and Quit.
xl.Application.Save()
xl.Application.Quit() 

#Cleanup the com reference. 
del xl

Write, from Python, to Excel:

import xlsxwriter

# Create an new Excel file and add a worksheet.
workbook = xlsxwriter.Workbook('C:/your_path/ranges_and_offsets.xlsx')
worksheet = workbook.add_worksheet()

# Widen the first column to make the text clearer.
worksheet.set_column('A:A', 20)

# Add a bold format to use to highlight cells.
bold = workbook.add_format('bold': True)

# Write some simple text.
worksheet.write('A1', 'Hello')

# Text with formatting.
worksheet.write('A2', 'World', bold)

# Write some numbers, with row/column notation.
worksheet.write(2, 0, 123)
worksheet.write(3, 0, 123.456)


workbook.close()

from openpyxl import Workbook
wb = Workbook()

# grab the active worksheet
ws = wb.active

# Data can be assigned directly to cells
ws['A1'] = 42

# Rows can also be appended
ws.append([1, 2, 3])

# Python types will automatically be converted
import datetime
ws['A2'] = datetime.datetime.now()

# Save the file
wb.save("C:\\your_path\\sample.xlsx")

【讨论】:

感谢您的示例。我的用例与您提供的第二个示例一致。 #workbook1 有 10 个工作表 workbook1 = xlsxwriter.Workbook('C:/your_path/test1.xlsm') #workbook2 有 1 个工作表需要与相应工作表合并 在第一个文件 workbook2 = xlsxwriter.Workbook('C:/your_path/test2.xlsm') 我实际上可以通过拉动 vba_project.bin 并将这两个文件都视为“xlsx”并进行合并。但是当将 vba_project.bin 添加回合并的 xlsx 文件并将其重命名为“xlsm”时,我看不到宏。未应用 VBA 内容 pandas.read_excel() 0.21 版中,指定工作表名称的选项现在是sheet_name,而不是sheetname

以上是关于使用 pandas 读取和更新 XLSM 文件中的工作表,同时保留 VBA 代码的主要内容,如果未能解决你的问题,请参考以下文章

在python中使用pandas数据框保存.xlsm(excel)文件的问题

将 pandas 数据框写入 xlsm 文件(启用宏的 Excel)

在js中读取xlsm文件

Excel中的xlsm宏密码怎么破解

将 XLSM 转换为 XLSX

尝试读取 .xlsm 文件时出现 java.lang.NoSuchMethodError