我如何通过 xpath 进入网页的 "main" 部分?

How do I xpath into the "main" section of a web page?

我正在尝试使用 google 工作表中的 importxml 函数来查看 StubHub 事件的门票数据。

下面是页面上“inspect -> copy xpath”提供的xpath,但它不起作用。我已经玩了大约一个小时的路径,它似乎在“主”id 上被阻止了……我似乎无法在 header.

下获取数据
 *[@id="main"]/div/div/div[1]/div[2]/section[1]/div[1]/ul/div/li[1]

我发布了带有 link 的工作簿并更新了路径 here。我正在寻找要在工作簿中列出的门票清单(包括行、价格等)。

如何使用 xpath 语法查询“主要”部分?

不幸的是,您无法使用 Google Sheets 获得任何信息,因为需要 Javascript 才能显示数据。 IMPORTFROMWEB 支持 JS 渲染的插件在这个网站上也失败了。在我看来,您有 3 个选择来实现您的目标:

  • 使用Selenium + Python(或任何其他编程语言)
  • 使用Pythonrequests在后台加载JSON(需要凭据(>Authorization header)),然后对其进行过滤json。 JSON 的 url 开头为:https://www.stubhub.com/bfx/api/search/inventory/v2/listings?
  • 与之前的解决方案相同,但使用 Google AppsScript 直接来自 Google Sheets