我如何通过 xpath 进入网页的 "main" 部分？

Question

我正在尝试使用 google 工作表中的 importxml 函数来查看 StubHub 事件的门票数据。

下面是页面上“inspect -> copy xpath”提供的xpath，但它不起作用。我已经玩了大约一个小时的路径，它似乎在“主”id 上被阻止了……我似乎无法在 header.

下获取数据

 *[@id="main"]/div/div/div[1]/div[2]/section[1]/div[1]/ul/div/li[1]

我发布了带有 link 的工作簿并更新了路径 here。我正在寻找要在工作簿中列出的门票清单（包括行、价格等）。

如何使用 xpath 语法查询“主要”部分？

Answer 1

不幸的是，您无法使用 Google Sheets 获得任何信息，因为需要 Javascript 才能显示数据。 IMPORTFROMWEB 支持 JS 渲染的插件在这个网站上也失败了。在我看来，您有 3 个选择来实现您的目标：

使用Selenium + Python（或任何其他编程语言）
使用Python和requests在后台加载JSON（需要凭据（>Authorization header）），然后对其进行过滤json。 JSON 的 url 开头为：https://www.stubhub.com/bfx/api/search/inventory/v2/listings?
与之前的解决方案相同，但使用 Google AppsScript 直接来自 Google Sheets。

How do I xpath into the "main" section of a web page?