该文件是 XML 还是 HTML 文件?我该如何解析它?

Is this file an XML or HTML file? How can I parse it?

它有 100MB,所以这是其中的一部分: https://drive.google.com/file/d/0B1GVNHhYNzBINWl4TVFOejhtbEE/view?usp=sharing

它没有附带扩展名,我为其添加了 xml 扩展名。

这是什么文件类型,我该如何解析它?我尝试用 python 和 运行 解决错误。

您引用的文件是 XML export of a MediaWiki.

另见 MediaWiki page form XSD

您可以使用标准 XML 解析器对其进行解析,该解析器适用于大多数语言,包括 Python