亚马逊心愿单页面的显示格式

Format of How Amazon Wishlist pages are showed

这是一个概念性问题,而不是技术性问题,可能看起来很愚蠢,但无论如何都可以。

我正在尝试使用 jsoup 解析此 link 中给出的 public 亚马逊愿望清单。我目前可以做到。

正如您在上面link中看到的,该愿望清单中共有 9 页,格式为

   1 2 3 4 5 6 7 .. 9

如果 public 心愿单中有 n 个页面,那么格式将是

   1 2 3 4 5 6 7.. n
      

我需要知道亚马逊心愿单中的所有页面是如何表示的,以便我可以进行相应的编码。

欢迎使用包含 2、5、10、20 页的各种 public 亚马逊愿望清单的链接,以帮助了解页面的显示方式。

知道列表中有多少页的选项很少:

  1. 其他页面的所有链接都采用相同的格式:http://www.amazon.com/gp/registry/wishlist/3C96S5RO2A5A9/ref=cm_wl_sortbar_v_page_X/182-3573734-9320732?ie=UTF8&page=X(页码为 X 并且在 中出现 两次 [= =36=]), 所以你可以从 2 开始在 X 上循环。你应该得到所有页面的 200 OK 响应,直到你点击一个不存在的页面。
  2. 下载第一页并执行:

    Elements e = document.select("#wishlistPagination > span:nth-child(1) > div:nth-child(1)");
    String s = e.text();
    

    字符串 s 现在包含 - ?Previous 1 2 3 4 5 6 7 … 9 Next? 所以找到省略号之后或 "Next" 之前的数字就完成了。
    编辑
    再想一想 - 如果列表包含 7 页或更少,则字符串中不会有 "next",因此第一种方法(获取所有 URL 并更改页码 X)是更健壮。