Web 抓取:用于分页的 XPath
Web Scraping: XPath for Pagination
我正在尝试使用 Octoparse 抓取一些公司网站。我似乎无法让我的 XPath 适合分页。网站页面没有 'Next' 按钮。我正在尝试从每个页面抓取数据。
有什么建议吗?
我尝试了以下 XPath(以及其他一些失败):
//*[@id="main"]/div[2]/section/div[1]/nav/ul/li[1]/a/following-sibling::li[1]/a
这是一个公司的例子website我正在测试它。
您需要当前页面的下一页。 following-sibling
这很奇怪
//li[./a[@class="current"]]/following-sibling::li[1]
你可以阅读这篇文章here
在我修改 Redyukov Pavel 的有效解决方案时回答我自己的问题:
//a[@class='current']/../following-sibling::li[1]/a[1]
我正在尝试使用 Octoparse 抓取一些公司网站。我似乎无法让我的 XPath 适合分页。网站页面没有 'Next' 按钮。我正在尝试从每个页面抓取数据。 有什么建议吗?
我尝试了以下 XPath(以及其他一些失败):
//*[@id="main"]/div[2]/section/div[1]/nav/ul/li[1]/a/following-sibling::li[1]/a
这是一个公司的例子website我正在测试它。
您需要当前页面的下一页。 following-sibling
//li[./a[@class="current"]]/following-sibling::li[1]
你可以阅读这篇文章here
在我修改 Redyukov Pavel 的有效解决方案时回答我自己的问题:
//a[@class='current']/../following-sibling::li[1]/a[1]