可靠地解析 Java 中的 MediaWiki 文本(根据规定的标准)
Parsing MediaWiki text in Java reliably (according to stated criteria)
我正在尝试找到一个 API,这样我就可以避免自己构建可以将 MediaWiki 语法转换为 HTML 的东西(在 Java 中)。这似乎是一个足够普遍的问题,其他人应该已经解决了它,但到目前为止,我一直在互联网上挖掘,但没有运气。
我的第一个选择是 Mylyn Wikitext,它似乎有点工作,但我使用的是 Maven,Maven 存储库版本仍然是 0.94,它似乎只支持完整 Mediawiki 语法的一个子集——在特别是,它缺少用块引号替换 {{quote|sample quote text}} 的功能。
我也试过 Bliki v3.0.19,它似乎也缺少块引号。
根据一项快速调查,许多其他可用选项看起来要么不再维护,仍处于 alpha 阶段(例如 Sweble),要么就像是只有一个贡献者的项目,因此它们不太可能没有错误。
那么,有谁知道用于解析 MediaWiki 并生成 HTML 的 Java 库满足以下条件? (我的意图是具体和具体地说明我在寻找什么,所以它更像是一个二元选择,而不是一个意见问题。)
- 仍在维护 -- 更具体地说,它在过去两年内进行了更新
- 除了像 bold/italics/lists/links
这样更标准的标记之外,实际上还支持 Mediawiki {{quote}} 语法
- 不止一位源代码贡献者和至少数百名用户(作为大多数错误和性能问题可能已经解决的证据)
- 中央 Maven 存储库提供最新版本。
额外的功劳将归功于 API,其中解析语言易于扩展,并且也可以删除语言元素。
谢谢!
https://www.mediawiki.org/wiki/Alternative_parsers lists such attempts, but none can fulfill your requirements, i.e. being able to parse site-specific markup like an individual template.
parsing API used via Java clients可能是您最好的机会。如果由于某种原因您不能依赖 HTTP 请求,请在问题中说明您的用例。
我正在尝试找到一个 API,这样我就可以避免自己构建可以将 MediaWiki 语法转换为 HTML 的东西(在 Java 中)。这似乎是一个足够普遍的问题,其他人应该已经解决了它,但到目前为止,我一直在互联网上挖掘,但没有运气。
我的第一个选择是 Mylyn Wikitext,它似乎有点工作,但我使用的是 Maven,Maven 存储库版本仍然是 0.94,它似乎只支持完整 Mediawiki 语法的一个子集——在特别是,它缺少用块引号替换 {{quote|sample quote text}} 的功能。
我也试过 Bliki v3.0.19,它似乎也缺少块引号。
根据一项快速调查,许多其他可用选项看起来要么不再维护,仍处于 alpha 阶段(例如 Sweble),要么就像是只有一个贡献者的项目,因此它们不太可能没有错误。
那么,有谁知道用于解析 MediaWiki 并生成 HTML 的 Java 库满足以下条件? (我的意图是具体和具体地说明我在寻找什么,所以它更像是一个二元选择,而不是一个意见问题。)
- 仍在维护 -- 更具体地说,它在过去两年内进行了更新
- 除了像 bold/italics/lists/links 这样更标准的标记之外,实际上还支持 Mediawiki {{quote}} 语法
- 不止一位源代码贡献者和至少数百名用户(作为大多数错误和性能问题可能已经解决的证据)
- 中央 Maven 存储库提供最新版本。
额外的功劳将归功于 API,其中解析语言易于扩展,并且也可以删除语言元素。
谢谢!
https://www.mediawiki.org/wiki/Alternative_parsers lists such attempts, but none can fulfill your requirements, i.e. being able to parse site-specific markup like an individual template.
parsing API used via Java clients可能是您最好的机会。如果由于某种原因您不能依赖 HTTP 请求,请在问题中说明您的用例。