使用 xpath 从论坛 post 中排除 blockquote
Excluding blockquote from forum post with xpath
我正在尝试提取论坛 posts (message2),同时删除 blockquote (message1)。这里是HTML(post内容modified/simplified):
<div class="cPost_contentWrap ipsPad">
<div data-controller="core.front.core.lightboxedImages" class="ipsType_normal ipsType_richText ipsContained" itemprop="text" data-role="commentContent">
<blockquote data-ipsquote-contentclass="forums_Topic" data-ipsquote-contentid="40244" data-ipsquote-contenttype="forums" data-ipsquote-contentapp="forums" data-cite="aries_gurl" data-ipsquote-username="aries_gurl" data-ipsquote-contentcommentid="584324" class="ipsQuote" data-ipsquote="">
<div>
(message1)
</div>
</blockquote>
<p>(message2)</p>
</div>
我正在尝试使用以下 XPath 查询:
//div[@class="ipsType_normal ipsType_richText ipsContained"]/p[不是(@class="ipsQuote")]
然而,出于某种原因,此查询 returns 所有后续 post 在同一情况下,而不仅仅是当前节点 - 所以,以上述为参考,返回的结果将是:message2 message2 message2 message2,依此类推(总共 N 条消息)。
有没有办法让我一次收到一条消息?谢谢!
Is there a way I can get one message at a time?
是 ;) 使用:
(//div[@class="ipsType_normal ipsType_richText ipsContained"]/p[not(@class="ipsQuote")])[1]
第一个。 [n] 和 n=1..x 对于其他人。
我正在尝试提取论坛 posts (message2),同时删除 blockquote (message1)。这里是HTML(post内容modified/simplified):
<div class="cPost_contentWrap ipsPad">
<div data-controller="core.front.core.lightboxedImages" class="ipsType_normal ipsType_richText ipsContained" itemprop="text" data-role="commentContent">
<blockquote data-ipsquote-contentclass="forums_Topic" data-ipsquote-contentid="40244" data-ipsquote-contenttype="forums" data-ipsquote-contentapp="forums" data-cite="aries_gurl" data-ipsquote-username="aries_gurl" data-ipsquote-contentcommentid="584324" class="ipsQuote" data-ipsquote="">
<div>
(message1)
</div>
</blockquote>
<p>(message2)</p>
</div>
我正在尝试使用以下 XPath 查询:
//div[@class="ipsType_normal ipsType_richText ipsContained"]/p[不是(@class="ipsQuote")]
然而,出于某种原因,此查询 returns 所有后续 post 在同一情况下,而不仅仅是当前节点 - 所以,以上述为参考,返回的结果将是:message2 message2 message2 message2,依此类推(总共 N 条消息)。
有没有办法让我一次收到一条消息?谢谢!
Is there a way I can get one message at a time?
是 ;) 使用:
(//div[@class="ipsType_normal ipsType_richText ipsContained"]/p[not(@class="ipsQuote")])[1]
第一个。 [n] 和 n=1..x 对于其他人。