学习如何获取最后页码
rvest how to get last page number
正在尝试获取最后页码:
library(rvest)
url <- "https://www.immobilienscout24.de/Suche/de/wohnung-kaufen"
page <- read_html(url)
last_page_number <- page %>%
html_nodes("#pageSelection > select > option") %>%
html_text() %>%
length()
由于某种原因结果为空。
我可以通过此 url 访问页面,例如获取页面 #3:
https://www.immobilienscout24.de/Suche/de/wohnung-kaufen?pagenumber=3
您的方向是正确的,但我认为您选错了 css 选择器。尝试:
library(rvest)
url <- 'https://www.immobilienscout24.de/Suche/de/wohnung-kaufen'
url %>%
read_html() %>%
html_nodes('div.select-container select option') %>%
html_text() %>%
tail(1L)
#[1] "1650"
另一种选择:
url %>%
read_html() %>%
html_nodes('div.select-container select option') %>%
magrittr::extract2(length(.)) %>%
html_text()
正在尝试获取最后页码:
library(rvest)
url <- "https://www.immobilienscout24.de/Suche/de/wohnung-kaufen"
page <- read_html(url)
last_page_number <- page %>%
html_nodes("#pageSelection > select > option") %>%
html_text() %>%
length()
由于某种原因结果为空。
我可以通过此 url 访问页面,例如获取页面 #3:
https://www.immobilienscout24.de/Suche/de/wohnung-kaufen?pagenumber=3
您的方向是正确的,但我认为您选错了 css 选择器。尝试:
library(rvest)
url <- 'https://www.immobilienscout24.de/Suche/de/wohnung-kaufen'
url %>%
read_html() %>%
html_nodes('div.select-container select option') %>%
html_text() %>%
tail(1L)
#[1] "1650"
另一种选择:
url %>%
read_html() %>%
html_nodes('div.select-container select option') %>%
magrittr::extract2(length(.)) %>%
html_text()