使用 Jsoup HTML Parser 解析注释标签
Parsing commented tags with Jsoup HTML Parser
我正在使用基本的解析器程序解析一个简单的 HTML 文档。
Document doc = Jsoup.parse(responseFromServer);
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
String linkText = null;
for (Element link : links) {
linkText = link.text();
}
一些标签被注释掉了。我还想解析评论中的那些标签。由于我无权访问 HTML 输出源,因此我无法编辑文件和删除评论。
如何解析评论标签?
Jsoup 默认忽略评论。要解析它们,您可以在解析之前转换 html 字符串。沿线的东西
htmlStr = htmlStr.replaceAll("<!--|-->","");
document doc = Jsoup.parser(htmlStr);
如果注释掉的 html 确实或多或少有效 HTML,这只会毫无问题地工作。如果只是文本,您可能需要进行不同的转换。
我正在使用基本的解析器程序解析一个简单的 HTML 文档。
Document doc = Jsoup.parse(responseFromServer);
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
String linkText = null;
for (Element link : links) {
linkText = link.text();
}
一些标签被注释掉了。我还想解析评论中的那些标签。由于我无权访问 HTML 输出源,因此我无法编辑文件和删除评论。
如何解析评论标签?
Jsoup 默认忽略评论。要解析它们,您可以在解析之前转换 html 字符串。沿线的东西
htmlStr = htmlStr.replaceAll("<!--|-->","");
document doc = Jsoup.parser(htmlStr);
如果注释掉的 html 确实或多或少有效 HTML,这只会毫无问题地工作。如果只是文本,您可能需要进行不同的转换。