如何将每个段落从 .docx 文件复制到 .csv 文件中的新行?
How to copy each paragraph from .docx file to new row in .csv file?
我是 python 的新手。我正在尝试解析 .docx 文件并将每个段落复制到新的 .csv 文件中的单独行。
我能够准确地计算段落数,也能打印整个文档,但在尝试遍历文档以解析每个段落时收到错误消息。
所以您可以先安装名为 "docx" 的软件包(如果您有 python2 或 'pip install python-docx' for [=21,请在终端或命令行上执行 'pip install docx' =]).
那么你可以运行下面的代码:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
希望对您有所帮助。
BR
我是 python 的新手。我正在尝试解析 .docx 文件并将每个段落复制到新的 .csv 文件中的单独行。
我能够准确地计算段落数,也能打印整个文档,但在尝试遍历文档以解析每个段落时收到错误消息。
所以您可以先安装名为 "docx" 的软件包(如果您有 python2 或 'pip install python-docx' for [=21,请在终端或命令行上执行 'pip install docx' =]).
那么你可以运行下面的代码:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
希望对您有所帮助。 BR