Web 抓取仅在特定 class 之后出现的 class
Web scraping a class that only comes after a specific class
这是我要抓取的 html 的简化示例:
<td class='goal'>
<div>
<span>
<span>
<span class='cellValue'>
我想抓取 class 'cellValue' 下的值,但我的 html 中有很多不相关的值。我只想抓取 class 'goal'.
之后出现的那些
谁能告诉我该怎么做?我正在使用 puppeteer 并尝试了以下操作:
我试过类似的东西:
let goals = document.querySelectorAll('.goal > .cellValue')
let goals = document.querySelectorAll('.goal.cellValue')
没有任何帮助。请帮助:)
谢谢
你的select或者应该是.goal .cellValue
:
let goals = document.querySelectorAll('.goal .cellValue')
.goal > .cellValue
只会 select 具有 class .cellValue
的元素,其直接父元素具有 class .goal
。因为在您的情况下两者之间有几个祖先,所以您需要更广泛的 .goal .cellValue
查询。
此外,.goal.cellValue
selects 元素包含两个 classes。希望这对您有所帮助!
这是我要抓取的 html 的简化示例:
<td class='goal'>
<div>
<span>
<span>
<span class='cellValue'>
我想抓取 class 'cellValue' 下的值,但我的 html 中有很多不相关的值。我只想抓取 class 'goal'.
之后出现的那些谁能告诉我该怎么做?我正在使用 puppeteer 并尝试了以下操作:
我试过类似的东西:
let goals = document.querySelectorAll('.goal > .cellValue')
let goals = document.querySelectorAll('.goal.cellValue')
没有任何帮助。请帮助:)
谢谢
你的select或者应该是.goal .cellValue
:
let goals = document.querySelectorAll('.goal .cellValue')
.goal > .cellValue
只会 select 具有 class .cellValue
的元素,其直接父元素具有 class .goal
。因为在您的情况下两者之间有几个祖先,所以您需要更广泛的 .goal .cellValue
查询。
此外,.goal.cellValue
selects 元素包含两个 classes。希望这对您有所帮助!