使用 casperjs/phantomjs 抓取链接

Scrape links with casperjs/phantomjs

我正在尝试抓取 http://www.basketball-reference.com/teams/GSW/2016_games.html 上的所有 "Box Score" 链接。如果有人向我展示一种方法来一个一个地点击它们,那将是完美的,但只是刮掉它们就已经很棒了。 使用 'a'-selector 我设法从页面抓取所有链接:

$('tbody tr a').each(function (i) {
            console.log([i + 1, $(this).text(), ' // ' + $(this).attr('href')].join(': '));
        });

但我不知道如何指定 Box-score 链接

这个选择器会做你想做的事:

#teams_games > tbody > tr > td:nth-child(5) > a

一个有用的提示 -- 如果您在 Chrome 中使用开发人员工具,您可以右键单击一个被检查的元素并选择复制 >> 复制选择器以获得它的 css 选择器。这通常是为这种情况制作更通用的选择器的良好起点。