xpath 在 scrapy 中表现异常
xpath acting strangely in scrapy
假设我有这个代码:
<div class="page-header" align="center">
<h4>[<a href='browse?q=@section%200DAY' data-placement='top' rel='tooltip' data-original-title='Browse 0DAY'><strong>FIRST</strong></a>] SECOND-</a><a href=/browse?q=@grp%20GUSH rel='tooltip' data-original-title='Find more from GUSH'><b>THIRD</b></a> <h6>FOUR<br> <br/></h6> Search:
<a href="https://xxx1">xxx</a>,
</h4>
<br/>
</div>
我想过滤文本 FIRST、SECOND、THIRD 和 FOUR。我如何使用 XPATH 做到这一点?
我已经测试过了,没有成功:
'//div[@class="page-header"]/h4/text()' (for filter SECOND)
'//div[@class="page-header"]/h4/a[@rel=\'tooltip\']/text()' (for filter THIRD)
试试这个:
//div[@class="page-header"]/h4/node/text()[1]
对于过滤器 SECOND 和这个:
//div[@class="page-header"]/h4/a/b/node/text()[1]
第三个过滤器
让我知道它是否正常工作。
假设我有这个代码:
<div class="page-header" align="center">
<h4>[<a href='browse?q=@section%200DAY' data-placement='top' rel='tooltip' data-original-title='Browse 0DAY'><strong>FIRST</strong></a>] SECOND-</a><a href=/browse?q=@grp%20GUSH rel='tooltip' data-original-title='Find more from GUSH'><b>THIRD</b></a> <h6>FOUR<br> <br/></h6> Search:
<a href="https://xxx1">xxx</a>,
</h4>
<br/>
</div>
我想过滤文本 FIRST、SECOND、THIRD 和 FOUR。我如何使用 XPATH 做到这一点?
我已经测试过了,没有成功:
'//div[@class="page-header"]/h4/text()' (for filter SECOND)
'//div[@class="page-header"]/h4/a[@rel=\'tooltip\']/text()' (for filter THIRD)
试试这个:
//div[@class="page-header"]/h4/node/text()[1]
对于过滤器 SECOND 和这个:
//div[@class="page-header"]/h4/a/b/node/text()[1]
第三个过滤器
让我知道它是否正常工作。