如何解析提取的内容 HTML

Question

我正在使用 Jsoup 调用从网站获取以下内容。

<body>
 <div align="center" class="main">
  <div id="box1">
   <div id="heading" align="center">
    SENSEX
   </div>
   <div id="feeds" align="center">
    23,410.18
   </div>
   <div id="feeds_se" align="center">
    <img src="arrow_red.png" alt="" width="12" height="13" /> -378.61
   </div>
  </div>
  <div id="box2"></div>
 </div>
 <div align="center" class="main">
  <div id="box1">
   <div id="heading" align="center">
    USD/INR
   </div>
   <div id="feeds" align="center">
    68.50
   </div>
   <div id="feeds_se" align="center">
    <img src="arrow_red.png" alt="" width="12" height="13" /> -0.05
   </div>
  </div>
  <div id="box2"></div>
 </div>
 <div align="center" class="main">
  <div id="box1">
   <div id="heading" align="center">
    Crude($/BBL)
   </div>
   <div id="feeds" align="center">
    34.69
   </div>
   <div id="feeds_se" align="center">
    <img src="arrow_green.png" alt="" width="12" height="13" /> 1.68
   </div>
  </div>
  <div id="box2"></div>
 </div>

</body>

你能告诉我如何阅读这些值吗

如何检索值

SENSEX   23,410.18  -378.61
USD/INR   68.50    -0.05
Crude($/BBL)  34.69   1.68

Answer 1

要获取 HTML 页中的信息，您可以使用 CSS selectors。在您的示例中，您可以这样做：

Elements els = doc.select("#heading");
for (Element el : els){
    System.out.println(el.text());
}

请注意，您的 html 并非真正有效，因为它包含非唯一 ID。这应该不会发生在HTML，幸好Jsoup不关心这个

Answer 2

试试这个代码：

    Document doc = Jsoup.parse(yourHtmlString);
    Elements elements = doc.select("div.main");
    for (Element element : elements) {
        System.out.println(element.getElementById("heading").text() + " "
        + element.getElementById("feeds").text()+ " "
        + element.getElementById("feeds_se").text());       
    }

输出：

SENSEX 23,410.18 -378.61
USD/INR 68.50 -0.05
Crude($/BBL) 34.69 1.68

如何解析提取的内容 HTML

How to Parse through Contents of extracted HTML

jsoup