该文件是 XML 还是 HTML 文件?我该如何解析它?
Is this file an XML or HTML file? How can I parse it?
它有 100MB,所以这是其中的一部分:
https://drive.google.com/file/d/0B1GVNHhYNzBINWl4TVFOejhtbEE/view?usp=sharing
它没有附带扩展名,我为其添加了 xml 扩展名。
这是什么文件类型,我该如何解析它?我尝试用 python 和 运行 解决错误。
您引用的文件是 XML export of a MediaWiki.
您可以使用标准 XML 解析器对其进行解析,该解析器适用于大多数语言,包括 Python。
它有 100MB,所以这是其中的一部分: https://drive.google.com/file/d/0B1GVNHhYNzBINWl4TVFOejhtbEE/view?usp=sharing
它没有附带扩展名,我为其添加了 xml 扩展名。
这是什么文件类型,我该如何解析它?我尝试用 python 和 运行 解决错误。
您引用的文件是 XML export of a MediaWiki.
您可以使用标准 XML 解析器对其进行解析,该解析器适用于大多数语言,包括 Python。