亚马逊心愿单页面的显示格式
Format of How Amazon Wishlist pages are showed
这是一个概念性问题,而不是技术性问题,可能看起来很愚蠢,但无论如何都可以。
我正在尝试使用 jsoup 解析此 link 中给出的 public 亚马逊愿望清单。我目前可以做到。
正如您在上面link中看到的,该愿望清单中共有 9 页,格式为
1 2 3 4 5 6 7 .. 9
如果 public 心愿单中有 n 个页面,那么格式将是
1 2 3 4 5 6 7.. n
我需要知道亚马逊心愿单中的所有页面是如何表示的,以便我可以进行相应的编码。
欢迎使用包含 2、5、10、20 页的各种 public 亚马逊愿望清单的链接,以帮助了解页面的显示方式。
知道列表中有多少页的选项很少:
- 其他页面的所有链接都采用相同的格式:
http://www.amazon.com/gp/registry/wishlist/3C96S5RO2A5A9/ref=cm_wl_sortbar_v_page_X/182-3573734-9320732?ie=UTF8&page=X
(页码为 X
并且在 中出现 两次 [= =36=]), 所以你可以从 2 开始在 X 上循环。你应该得到所有页面的 200 OK
响应,直到你点击一个不存在的页面。
下载第一页并执行:
Elements e = document.select("#wishlistPagination > span:nth-child(1) > div:nth-child(1)");
String s = e.text();
字符串 s
现在包含 - ?Previous 1 2 3 4 5 6 7 … 9 Next?
所以找到省略号之后或 "Next" 之前的数字就完成了。
编辑
再想一想 - 如果列表包含 7 页或更少,则字符串中不会有 "next",因此第一种方法(获取所有 URL 并更改页码 X)是更健壮。
这是一个概念性问题,而不是技术性问题,可能看起来很愚蠢,但无论如何都可以。
我正在尝试使用 jsoup 解析此 link 中给出的 public 亚马逊愿望清单。我目前可以做到。
正如您在上面link中看到的,该愿望清单中共有 9 页,格式为
1 2 3 4 5 6 7 .. 9
如果 public 心愿单中有 n 个页面,那么格式将是
1 2 3 4 5 6 7.. n
我需要知道亚马逊心愿单中的所有页面是如何表示的,以便我可以进行相应的编码。
欢迎使用包含 2、5、10、20 页的各种 public 亚马逊愿望清单的链接,以帮助了解页面的显示方式。
知道列表中有多少页的选项很少:
- 其他页面的所有链接都采用相同的格式:
http://www.amazon.com/gp/registry/wishlist/3C96S5RO2A5A9/ref=cm_wl_sortbar_v_page_X/182-3573734-9320732?ie=UTF8&page=X
(页码为X
并且在 中出现 两次 [= =36=]), 所以你可以从 2 开始在 X 上循环。你应该得到所有页面的200 OK
响应,直到你点击一个不存在的页面。 下载第一页并执行:
Elements e = document.select("#wishlistPagination > span:nth-child(1) > div:nth-child(1)"); String s = e.text();
字符串
s
现在包含 -?Previous 1 2 3 4 5 6 7 … 9 Next?
所以找到省略号之后或 "Next" 之前的数字就完成了。
编辑
再想一想 - 如果列表包含 7 页或更少,则字符串中不会有 "next",因此第一种方法(获取所有 URL 并更改页码 X)是更健壮。