学习如何获取最后页码

rvest how to get last page number

正在尝试获取最后页码:

library(rvest)
url <- "https://www.immobilienscout24.de/Suche/de/wohnung-kaufen"
page <- read_html(url)
last_page_number <- page %>%
        html_nodes("#pageSelection > select > option") %>%
        html_text() %>%
        length()

由于某种原因结果为空。

我可以通过此 url 访问页面,例如获取页面 #3:

https://www.immobilienscout24.de/Suche/de/wohnung-kaufen?pagenumber=3

您的方向是正确的,但我认为您选错了 css 选择器。尝试:

library(rvest)
url <- 'https://www.immobilienscout24.de/Suche/de/wohnung-kaufen'
url %>%
  read_html() %>%
  html_nodes('div.select-container select option') %>%
  html_text() %>%
  tail(1L)

#[1] "1650"

另一种选择:

url %>%
  read_html() %>%
  html_nodes('div.select-container select option') %>%
  magrittr::extract2(length(.)) %>%
  html_text()