Python: 如何修改Microsoft Office文件的元数据?
Python: How to Modify metadata of Microsoft Office files?
如何修改 Microsoft Office 文档的元数据?我找到了 Jpg、PNG 和 PDF 文件的结果数。任何人都可以建议 Office 文件元数据库?
对于较新的格式,它们通常只是压缩 xml,因此您可以使用标准库来解压缩和解析 xml。一些获取文档创建者的代码以前是 posted as an answer on Whosebug.
import zipfile, lxml.etree
# open zipfile
zf = zipfile.ZipFile('my_doc.docx')
# use lxml to parse the xml file we are interested in
doc = lxml.etree.fromstring(zf.read('docProps/core.xml'))
# retrieve creator
ns={'dc': 'http://purl.org/dc/elements/1.1/'}
creator = doc.xpath('//dc:creator', namespaces=ns)[0].text
对于较旧的格式,您可能需要查看 hachoir-metadata library
如何修改 Microsoft Office 文档的元数据?我找到了 Jpg、PNG 和 PDF 文件的结果数。任何人都可以建议 Office 文件元数据库?
对于较新的格式,它们通常只是压缩 xml,因此您可以使用标准库来解压缩和解析 xml。一些获取文档创建者的代码以前是 posted as an answer on Whosebug.
import zipfile, lxml.etree
# open zipfile
zf = zipfile.ZipFile('my_doc.docx')
# use lxml to parse the xml file we are interested in
doc = lxml.etree.fromstring(zf.read('docProps/core.xml'))
# retrieve creator
ns={'dc': 'http://purl.org/dc/elements/1.1/'}
creator = doc.xpath('//dc:creator', namespaces=ns)[0].text
对于较旧的格式,您可能需要查看 hachoir-metadata library