正在用 <br> 标签 (Python) 解析 html

Parsing html with <br> tags (Python)

我正在使用 lxml 来解析一些 html。 HTML 看起来像:

<td valign="top">first text field<br>second text field</td>

不,break 标签没有在任何地方关闭。

element.text returns 两个中的第一个,element.xpath('string()') returns 都没有 \n 或其他分隔符。

我想我可以只解析两次,如果我只想要第二个文本字段,"subtract" 可以从后者解析前者,但这并不理想。我想一定有其他方法可以获取第二个文本字段,但我很困惑。

自己回答。 element.xpath('text()') returns 我正在寻找的两个东西的数组。