网络抓取、选择器小工具和 rvest 的问题

Question

我是网络抓取的新手，目前正在努力解决以下页面的 table：

https://www.ggesports.com/en-us/stats/lol/global/Team

我测试了从 table 之外的网站抓取文本，这没有问题，但是当我尝试抓取 table 的一列时，它只有 returns 输出“字符（0）”。

我使用选择器小工具来识别特定的 CSS 选择器。之后我到目前为止尝试过：

library(rvest)
library(dplyr)

url <- "https://www.ggesports.com/en-us/stats/lol/global/Team"
Stats <- read_html(url)


Name <- hot100 %>% 
  rvest::html_nodes('body') %>% 
  xml2::xml_find_all("//span[contains(@class, 'team-name')]") %>% 
  rvest::html_text()
Name

# and

Name_html <- html_nodes(Stats,'.team-name')
Name <- html_text(Name_html)
Name

如有任何帮助，我将不胜感激。预先感谢任何人！

Answer 1

数据是从您可以在网络选项卡中找到的另一个端点动态提取的。向该端点发出请求：

library(jsonlite)

data <- jsonlite::read_json('https://www.ggesports.com/en-us/stats/lol/global/Team/GetRankingList?season=-1&name=&regionId=50', simplifyVector = T)

网络抓取、选择器小工具和 rvest 的问题

Troubles with webscraping, selector gadget and rvest

r

web-scraping

rvest