Openpyxl 保存损坏/不可读的文件。没有报错,只是shell重启

Posted

技术标签:

【中文标题】Openpyxl 保存损坏/不可读的文件。没有报错,只是shell重启【英文标题】:Openpyxl saving a corrupted/ not readable file. No error report, just shell restart 【发布时间】:2020-04-02 15:57:04 【问题描述】:

我已经学习了几个月的 Python 来自动化一些无聊的工作任务(主要是 Excel),并且在大多数情况下我都成功了。但是两周以来,我一直在尝试解决我在使用从其他电子表格收集的数据填充每周报告时遇到的一个问题。 根据openpyxl.__version__,openpyxl 版本是 3.0.2,我使用的是带有内置 IDLE 的 Python 3.6.7。 编辑:这是完整代码https://pastebin.com/MrBZ5Usu。

程序应该做的是:

    从一周的报告中收集数据并将其放入列表中 从电子表格中收集数据,其中日期作为键,小时作为字典的值 打开一个模板电子表格,用这些数据填充它并将其另存为另一个文件。

现在当我运行程序时,我没有收到错误报告。 Python shell 重新启动。该文件在那里,但它是 0 字节并且无法打开。 我已经运行了一些测试,直到保存工作簿的那一刻,一切似乎都很好。调用时,新工作簿中的单元格会显示我放入其中的值。每条数据都采用所需的标准化格式/类型。 当我调用wb.save(filename) 方法时,shell 会重新启动。 我尝试了不同的方法将数据放入单元格(使用 f 字符串循环,使用预定义的单元格坐标列表循环,对单元格和数据进行硬编码)但无济于事。 Shell 重启 - 0 字节电子表格。 我已经确保我机器上的每个模块都是最新的等等。 我已经成功地将数据写入搁置模块,然后用另一个脚本提取它们。 第二个脚本(只有几行,使用相同的代码来填充单元格)成功保存了一个有效的工作簿,但前提是它是同一个文件。 我已经尝试在主程序中更改它,但没有保存选项(作为不同的文件,作为同一个文件,文件的shutil副本(!))授予成功。 我的代码显然有问题(除了所有新手的错误),但我不能把手放在上面。这是代码 - 有人有什么建议吗?根据要求,我可以提供基本上完整的脚本(大约 120 行)。

endlist = load_workbook(f"Endlist_monat1_2019.xlsx", data_only=True)
endlistws = endlist.active


#creating an empty dict, to store the dates and hours from endlist
endlist_hrs = 

#creating a dict with dates as keys and empty lists as values
for cell in endlistws['A']:
    if cell.value != None:
        if weeknum(dateConverter(cell.value)) == kw_num:
            if dateConverter(endlistws[f'Acell.row'].value) in endlist_hrs.keys(): #is the date already in the dict?
                pass # it is, so pass
            else:
                endlist_hrs[dateConverter((endlistws[f'Acell.row'].value))] = [] #its not, so add it
    else:
        pass #does not match

# iterating over keys in the endlist_hrs dict, checking the dates in A column - not the best solution, iterating every time over whole A column - to be upgraded
for key in endlist_hrs.keys():
    for cell in endlistws['A']:
        if cell.value != None:
            if dateConverter(cell.value) == key:
                endlist_hrs[key].append(czasownik(endlistws[f'Jcell.row'].value))


endlist.close() #closing the endlist workbook

#creating a dict with dates as keys and sum of hours as values - ready to be inserted into cells in the Check workbook
full_endlist_data = k:sum(v) for (k,v) in endlist_hrs.items()

#copying the dailycheck workbook and producing the final output

faylneym = f"DCkw_num.xlsx"
paf = os.path.join(values['Browse0'], faylneym)

shutil.copy2(values['Browse1'], paf)

dcwb = load_workbook(paf, write_only=True)
dcws = dcwb['KW_XX']
dcws.title = str(kw)
dcwb.save(paf)
dcwb = load_workbook(paf)
dcws = dcwb.active

for x,y in enumerate(strdate, start=2):
    dcws[f'Ax'].value = y
for x,y in enumerate(strdate, start=12):
    dcws[f'Ax'].value = y
for x,y in enumerate(hours_from_eos2, start=2):
    dcws[f'Ex'].value = y
for x,y in enumerate(full_endlist_data.values(), start=2):
    dcws[f'Dx'].value = y

之后我只是保存工作簿。

【问题讨论】:

打印(openpyxl.__version__) 3.0.2 如果您认为这是一个错误,请在 bitbucket.org/openpyxl 提交问题。 我不明白问题出在哪里。请简化它。 用数据填充工作簿中的单元格并尝试保存后 - python shell 重新启动。文件存在,但它是空的(0 字节)。在保存点之前,一切正常。 “Python shell 重新启动”是什么意思? 【参考方案1】:

我已经重建了我的代码,它具有比结构特征更多的功能。我还将代码的填写部分拆分为 4 个函数。

    复制电子表格并为其命名。 打开电子表格并用之前生成的列表(6 项,给定 WK 中的日期范围)填写它,然后保存工作簿。 打开工作簿,遍历包含 6 个项目的列表并将它们放置到相应位置。保存工作簿。 打开工作簿,遍历 dict 值并将它们放入计划的单元格中。保存工作簿。

这样做我不会遇到任何错误、崩溃或意外行为。工作簿按预期填充数据且无错误。不幸的是,我还不够先进,无法查明确切的原因。 这是最终代码:

def newWB(source, target, kw_num):
    faylneym = f"DCkw_num.xlsx"
    paf = os.path.join(target, faylneym)
    shutil.copy2(source, paf)
    return paf



def filling1(wbpaf, strdata):
    try:
        dcwb = load_workbook(wbpaf)
        dcws = dcwb.active

        for x, y in enumerate(strdate, start=2):
            dcws[f'Ax'].value = y
        for x, y in enumerate(strdate, start=12):
             dcws[f'Ax'].value = y
        # for x, y in enumerate(hours_from_eos, start=2):
        #     dcws[f'Ex'].value = y
        # for x, y in enumerate(endlist_hrs.values(), start=2):
        #     dcws[f'Dx'].value = y
        dcwb.save(wbpaf)

    except:
        sg.Popup("Filling1 with data failed")

def filling2(wbpaf, hours_from_eos):
    try:
        dcwb = load_workbook(wbpaf)
        dcws = dcwb.active
        for x, y in enumerate(hours_from_eos, start=2):
            dcws[f'Ex'].value = y
        dcwb.save(wbpaf)
    except:
        sg.Popup("Filling2 with data failed")

def filling3(wbpaf, endlist_hrs):
    try:
        dcwb = load_workbook(wbpaf)
        dcws = dcwb.active
        for x, y in enumerate(endlist_hrs.values(), start=2):
            dcws[f'Dx'].value = y
        dcwb.save(wbaf)
    except:
        sg.Popup("Filling3 failed")'

【讨论】:

以上是关于Openpyxl 保存损坏/不可读的文件。没有报错,只是shell重启的主要内容,如果未能解决你的问题,请参考以下文章

在 hdf5save 中保存会创建一个不可读的文件

Pandas ExcelWriter Openpyxl 正在创建一个必须恢复的损坏文件

解决 php artisan route:list 报错oauth-private.key文件不存在或不可读的

OpenPyXL 不会保存到带有替换更改的新 Excel 文件

使用 openpyxl 模块写入电子表格会创建损坏的电子表格,如何使用 zipfile 模块修复?

OpenCV Error: Assertion failed (scn == 3 || scn == 4) in cv::cvtColor