使用 openpyxl 模块写入电子表格会创建损坏的电子表格,如何使用 zipfile 模块修复?

Using openpyxl module to write to spreadsheet creates a damaged spreadsheet, how to fix with zipfile module?

我有一个使用 openpyxl 写入电子表格的程序。程序执行后,单元格按预期填充,但电子表格已损坏。 Excel 修复了电子表格,然后我可以再次查看它。

import openpyxl
from openpyxl import load_workbook
amounts, row = [1, 2, 3, 4, 5], 2
book = load_workbook("output.xlsx")
sheet = book.active

for i, value in enumerate(amounts):
    sheet.cell(column=i+1, row=row, value=value)  
print ("Sheet updating complete.")
book.save("output.xlsx")

我曾尝试使用 Microsoft 的 Open XML SDK 生产力工具来比较好文件和坏文件,并注意到缺少 styles.xml。我尝试使用从另一个问题获得的以下源代码复制它,但它并没有解决我的问题。

import zipfile
with zipfile.ZipFile('outputcopy.xlsx', 'r') as zgood:
    styles_xml = zgood.read('xl/styles.xml')
with zipfile.ZipFile('output.xlsx', 'a') as zbad:
    zbad.writestr('xl/styles.xml', styles_xml)

我可以从 Excel 生成的修复日志中确认问题出在 xl/styles.xml。我需要将此 xml 文件从好的副本复制到坏的副本。

如何复制 xl/styles.xml 文件,以便程序可以 运行 而不会损坏 output.xlsx

我已再次尝试解决此问题。万一 styles.xml 无法从不同的 Excel 文件复制;我在 book.save("output.xlsx") 之前从 output.xlsx 打开了 styles.xml。保存后,我从保存语句之前获取 styles.xml 并写入它。不幸的是,这并没有改变任何东西,我仍然得到一个损坏的 Excel 文件。通过这次尝试,我的测试代码如下所示:

import openpyxl
import zipfile

from openpyxl import load_workbook
amounts, indexValue, row = [1, 2, 3, 4, 5], 0, 2
book = load_workbook("output.xlsx")
sheet = book.active

for i, value in enumerate(amounts):
    sheet.cell(column=i+1, row=row, value=value)  
print ("Sheet updating complete.")

with zipfile.ZipFile('output.xlsx', 'r') as zgood:
    styles_xml = zgood.read('xl/styles.xml')

book.save("output.xlsx")

with zipfile.ZipFile('output.xlsx', 'a') as zbad:
    zbad.writestr('xl/styles.xml', styles_xml)

我试过另存为一个全新的 Excel 文件,但仍然有同样的问题。我尝试使用 zip fileoutput.xlsx 打开并写入新保存的文件,但仍然没有结果。

import openpyxl
import zipfile
from openpyxl import load_workbook

amounts, indexValue, row, cell = [1, 2, 3, 4, 5], 0, 2, "A2"
book = load_workbook("output.xlsx")
sheet = book.active

while indexValue != 5:
    sheet[cell] = amounts[indexValue]
    indexValue += 1
    cell = chr(ord(cell[0]) + 1) + str(cell[1])
print ("Sheet updating complete.")

book.save("test.xlsx")

with zipfile.ZipFile('output.xlsx', 'r') as zgood:
    styles_xml = zgood.read('xl/styles.xml')
with zipfile.ZipFile('test.xlsx', 'a') as zbad:
    zbad.writestr('xl/styles.xml', styles_xml)

虽然我已经修复了这个问题,但值得注意的是,这个问题似乎只在加载工作簿时出现。我创建了另一个程序,其中包含创建工作簿的电子表格,而不是加载它。因此,电子表格不会保存损坏。

在确认问题出在 styles.xml 之后,我确定问题很可能与书写单元格的样式格式有关。通过使用 openpyxl 模块中的 styles,我已经解决了这个问题。

我声明了一个变量,在本例中为fontStyle,并设置了所有样式设置:

fontStyle = Font(name="Calibri", size=12, color=colors.BLACK)

在给每个单元格写amounts时,我还设置了这些单元格的样式使用fontStyle:

sheet[cell].font = fontStyle

完成的代码如下所示:

import openpyxl
from openpyxl import load_workbook
from openpyxl.styles import colors
from openpyxl.styles import Font, Color

fontStyle = Font(name="Calibri", size=12, color=colors.BLACK)
amounts, indexValue, cell = [1, 2, 3, 4, 5], 0, "A2"
book = load_workbook("output.xlsx")
sheet = book.active

while indexValue != 5:
    sheet[cell] = amounts[indexValue]
    sheet[cell].font = fontStyle
    indexValue += 1
    cell = chr(ord(cell[0]) + 1) + str(cell[1])

print ("Sheet updating complete.")
book.save("output.xlsx")

我相信这行得通,因为书写方法没有默认的样式设置。这可以解释为什么在使用 Open XML SDK 生产力工具时缺少 styles.xml。修复后再次检查此 Excel 文件,我可以确认 styles.xml 不再丢失。

文件保存后不再损坏,可以再次正常打开。此外,我现在可以执行此脚本再次写入 Excel 文件,而无需打开和关闭来修复它。

请注意,我还更改了原始循环的循环 - 作为我解决问题的尝试之一。这对最终结果没有影响——这完全取决于所写单元格的样式。

这并不能完全回答 zipfile 专门解决问题的问题,但它确实解决了问题。