正在用 <br> 标签 (Python) 解析 html

Question

我正在使用 lxml 来解析一些 html。 HTML 看起来像：

<td valign="top">first text field<br>second text field</td>

不，break 标签没有在任何地方关闭。

element.text returns 两个中的第一个，element.xpath('string()') returns 都没有 \n 或其他分隔符。

我想我可以只解析两次，如果我只想要第二个文本字段，"subtract" 可以从后者解析前者，但这并不理想。我想一定有其他方法可以获取第二个文本字段，但我很困惑。

Answer 1

自己回答。 element.xpath('text()') returns 我正在寻找的两个东西的数组。

Parsing html with <br> tags (Python)