你如何使用python-docx从word文档的某个部分读取table?

How do you read a table from a certain part in a word document using python-docx?

我正在使用 Python 从文档中读取许多 table 的 word 文件。我只需要从某些 table 中提取数据,具体取决于它们出现的部分。有什么方法可以搜索文件,到达特定行,然后读取出现在 table 之后的 table线?

例如,如果 word 文档是这样的:

1
2
3
[table]
4
5
6
[table]

我能读懂“6”之后的 table 吗?

读取'second table'是行不通的,因为在table之前出现的table的数量是任意的;我需要阅读它,因为它出现在“6”之后。

此处的代码可能会引起您的兴趣:https://github.com/python-openxml/python-docx/issues/276#issuecomment-199502885

我相信,您正在寻找的是一种按出现顺序迭代文档中 块级 项目的方法。 Word 文档有两种类型的块级项目、段落和表格。上面 link 处的函数允许您按文档顺序迭代那些。