如何使用 cheerio 从网站上抓取数据
How to scrape data from website with cheerio
我正在尝试抓取方舟:生存进化维基,但没有成功。嵌套元素和相同的 class-name 元素让我失望。
https://ark.gamepedia.com/Pteranodon
已尝试搜索论坛,但找不到我的问题的答案。
const $ = cheerio.load(html);
const $dossier = $('.info-framework');
const $domestication = $dossier.find('div:nth-child(4)');
我设法获取了包含我需要的内容的 div,但我从这里尝试的所有内容都以未定义结尾。具体来说,我正在尝试获取 "tameable"、"rideable" 和 "breedable" 元素。如果有人能给我指出正确的方向,或者告诉我如何获取数据,这样我就可以学习并希望获取我需要的其余数据,那就太好了。
这里有一些你可以建立的例子:
const abilities = Array.from($('.info-unit').eq(6).find('.info-X3-33')).map(element => element.innerText)
编辑:
我正在尝试抓取方舟:生存进化维基,但没有成功。嵌套元素和相同的 class-name 元素让我失望。 https://ark.gamepedia.com/Pteranodon
已尝试搜索论坛,但找不到我的问题的答案。
const $ = cheerio.load(html);
const $dossier = $('.info-framework');
const $domestication = $dossier.find('div:nth-child(4)');
我设法获取了包含我需要的内容的 div,但我从这里尝试的所有内容都以未定义结尾。具体来说,我正在尝试获取 "tameable"、"rideable" 和 "breedable" 元素。如果有人能给我指出正确的方向,或者告诉我如何获取数据,这样我就可以学习并希望获取我需要的其余数据,那就太好了。
这里有一些你可以建立的例子:
const abilities = Array.from($('.info-unit').eq(6).find('.info-X3-33')).map(element => element.innerText)
编辑: