我如何通过 xpath 进入网页的 "main" 部分?
How do I xpath into the "main" section of a web page?
我正在尝试使用 google 工作表中的 importxml 函数来查看 StubHub 事件的门票数据。
下面是页面上“inspect -> copy xpath”提供的xpath,但它不起作用。我已经玩了大约一个小时的路径,它似乎在“主”id 上被阻止了……我似乎无法在 header.
下获取数据
*[@id="main"]/div/div/div[1]/div[2]/section[1]/div[1]/ul/div/li[1]
我发布了带有 link 的工作簿并更新了路径 here。我正在寻找要在工作簿中列出的门票清单(包括行、价格等)。
如何使用 xpath 语法查询“主要”部分?
不幸的是,您无法使用 Google Sheets
获得任何信息,因为需要 Javascript 才能显示数据。 IMPORTFROMWEB
支持 JS 渲染的插件在这个网站上也失败了。在我看来,您有 3 个选择来实现您的目标:
- 使用
Selenium
+ Python
(或任何其他编程语言)
- 使用
Python
和requests
在后台加载JSON(需要凭据(>Authorization
header)),然后对其进行过滤json
。 JSON 的 url 开头为:https://www.stubhub.com/bfx/api/search/inventory/v2/listings?
- 与之前的解决方案相同,但使用
Google AppsScript
直接来自 Google Sheets
。
我正在尝试使用 google 工作表中的 importxml 函数来查看 StubHub 事件的门票数据。
下面是页面上“inspect -> copy xpath”提供的xpath,但它不起作用。我已经玩了大约一个小时的路径,它似乎在“主”id 上被阻止了……我似乎无法在 header.
下获取数据 *[@id="main"]/div/div/div[1]/div[2]/section[1]/div[1]/ul/div/li[1]
我发布了带有 link 的工作簿并更新了路径 here。我正在寻找要在工作簿中列出的门票清单(包括行、价格等)。
如何使用 xpath 语法查询“主要”部分?
不幸的是,您无法使用 Google Sheets
获得任何信息,因为需要 Javascript 才能显示数据。 IMPORTFROMWEB
支持 JS 渲染的插件在这个网站上也失败了。在我看来,您有 3 个选择来实现您的目标:
- 使用
Selenium
+Python
(或任何其他编程语言) - 使用
Python
和requests
在后台加载JSON(需要凭据(>Authorization
header)),然后对其进行过滤json
。 JSON 的 url 开头为:https://www.stubhub.com/bfx/api/search/inventory/v2/listings?
- 与之前的解决方案相同,但使用
Google AppsScript
直接来自Google Sheets
。