使用 JSOUP 从另一个网站获取数据

Fetching data from another website with JSOUP

基本上,我需要 table 包含所有可能存在的书籍,但我不想这样做,因为我是一个非常懒惰的人 xD。所以,我的问题是..我可以使用一个我想到的网站吗,就像切断这个网站的其余部分(我不需要的),只留下搜索部分(也许做一些改变布局)... 然后,进行搜索,找到这本书,并在我的数据库中只存储对我有意义的数据。那可能吗?我听说 JSOUP 可以提供帮助。 所以,我只想要一些提示。 (感谢阅读)。

站点:http://www.isbn.bn.br/website/consulta/cadastro

是的,你可以使用 Jsoup 做到这一点,主要问题是你分享的 URL 使用 JavaScript 所以你需要使用 Selenium 来强制执行 JS 或者你也可以拿到书 URL 并解析它。

使用 Jsoup 解析网页的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您在文档中检索整个 HTML,因此您可以使用 CSS 选择器获取元素中包含的任何元素,例如,如果在 HTML 中您想要检索网页的标题,您可以使用:

Elements elements = document.select("title");

以及您要从中检索信息的每个 HTML 标签。您可以查看 Jsoup 文档并查看一些解释的示例:Jsoup

希望对您有所帮助!