Scrapy CSS 选择器忽略标签并仅获取文本

Scrapy CSS Selector ignore tags and get text only

我有以下 HTML :

<li class="last">
    <span>SKU:</span> 483151
</li>

我能够 select 他们使用 :

SKU_SELECTOR = '.aaa .bbb .last ::text'
sku = response.css(SKU_SELECTOR).extract_first().strip()

如何只获取数字而忽略跨度

您的cssselect或在::text之前有不必要的space。

SKU_SELECTOR = '.aaa .bbb .last ::text'
                               ^

Space 表示任何 decendant-or-self 节点都符合这个 select 或者你想 select 仅在 self.

下的文本

我成功了:

>[0]: s = Selector(tex='...')
>[1]: s.css('.last::text').extract()
<[1]: [u'\n    ', u' 483151\n']