如何从 flipkart 评论页面获取正确的选择器以进行网络抓取?
How do I get the correct selector from flipkart review page for web scraping?
选择器中的评论有多个 类 "row _3wYu6I _3BRC7L"。
但是当抓取时,响应没有上面的选择器,而是 "row _3wYu6I _1KVtzT" selector.And 这个选择器有空 list.Actually flipkart 页面中所有 类 值为“_3BRC7L”Flipkart page are converted into classes with values "_1KVtzT" in response that I get through scraping. The list of elements that I get when using xpath of the parent class。我应该如何解决这个问题?
使用 xpath 可以得到 div 的某个 class 包含一个段落,id
包含价值评论。
这个选择器是一个很好的开始,您可以从这里构建任何选择器以供审查。
//div[.//p[contains(@id, 'review')]][@class='col']
flipkart 页面通过 ajax requests.That 生成动态内容是我无法获得正确的 class 选择器的原因。现在,我按照以下答案的说明更改了我的代码:。
这对我来说非常有用且简单,因为我是新手,不需要使用 scrapy 或 casperjs。
选择器中的评论有多个 类 "row _3wYu6I _3BRC7L"。 但是当抓取时,响应没有上面的选择器,而是 "row _3wYu6I _1KVtzT" selector.And 这个选择器有空 list.Actually flipkart 页面中所有 类 值为“_3BRC7L”Flipkart page are converted into classes with values "_1KVtzT" in response that I get through scraping. The list of elements that I get when using xpath of the parent class。我应该如何解决这个问题?
使用 xpath 可以得到 div 的某个 class 包含一个段落,id
包含价值评论。
这个选择器是一个很好的开始,您可以从这里构建任何选择器以供审查。
//div[.//p[contains(@id, 'review')]][@class='col']
flipkart 页面通过 ajax requests.That 生成动态内容是我无法获得正确的 class 选择器的原因。现在,我按照以下答案的说明更改了我的代码: