Scrapy CSS 选择器忽略标签并仅获取文本
Scrapy CSS Selector ignore tags and get text only
我有以下 HTML :
<li class="last">
<span>SKU:</span> 483151
</li>
我能够 select 他们使用 :
SKU_SELECTOR = '.aaa .bbb .last ::text'
sku = response.css(SKU_SELECTOR).extract_first().strip()
如何只获取数字而忽略跨度
您的cssselect或在::text
之前有不必要的space。
SKU_SELECTOR = '.aaa .bbb .last ::text'
^
Space 表示任何 decendant-or-self 节点都符合这个 select 或者你想 select 仅在 self.
下的文本
我成功了:
>[0]: s = Selector(tex='...')
>[1]: s.css('.last::text').extract()
<[1]: [u'\n ', u' 483151\n']
我有以下 HTML :
<li class="last">
<span>SKU:</span> 483151
</li>
我能够 select 他们使用 :
SKU_SELECTOR = '.aaa .bbb .last ::text'
sku = response.css(SKU_SELECTOR).extract_first().strip()
如何只获取数字而忽略跨度
您的cssselect或在::text
之前有不必要的space。
SKU_SELECTOR = '.aaa .bbb .last ::text'
^
Space 表示任何 decendant-or-self 节点都符合这个 select 或者你想 select 仅在 self.
下的文本我成功了:
>[0]: s = Selector(tex='...')
>[1]: s.css('.last::text').extract()
<[1]: [u'\n ', u' 483151\n']