xpath 在 scrapy 中表现异常

Question

假设我有这个代码：

<div class="page-header" align="center">
<h4>[<a href='browse?q=@section%200DAY' data-placement='top' rel='tooltip' data-original-title='Browse 0DAY'><strong>FIRST</strong></a>] SECOND-</a><a href=/browse?q=@grp%20GUSH rel='tooltip' data-original-title='Find more from GUSH'><b>THIRD</b></a> <h6>FOUR<br> <br/></h6> Search:
<a href="https://xxx1">xxx</a>,
</h4>
<br/>
</div>

我想过滤文本 FIRST、SECOND、THIRD 和 FOUR。我如何使用 XPATH 做到这一点？

我已经测试过了，没有成功：

'//div[@class="page-header"]/h4/text()' (for filter SECOND)
'//div[@class="page-header"]/h4/a[@rel=\'tooltip\']/text()' (for filter THIRD)

Answer 1

试试这个：

//div[@class="page-header"]/h4/node/text()[1]

对于过滤器 SECOND 和这个：

//div[@class="page-header"]/h4/a/b/node/text()[1]

第三个过滤器

让我知道它是否正常工作。

xpath 在 scrapy 中表现异常

xpath acting strangely in scrapy

html

xpath

scrapy