正在用 <br> 标签 (Python) 解析 html
Parsing html with <br> tags (Python)
我正在使用 lxml 来解析一些 html。 HTML 看起来像:
<td valign="top">first text field<br>second text field</td>
不,break 标签没有在任何地方关闭。
element.text
returns 两个中的第一个,element.xpath('string()')
returns 都没有 \n
或其他分隔符。
我想我可以只解析两次,如果我只想要第二个文本字段,"subtract" 可以从后者解析前者,但这并不理想。我想一定有其他方法可以获取第二个文本字段,但我很困惑。
自己回答。 element.xpath('text()')
returns 我正在寻找的两个东西的数组。
我正在使用 lxml 来解析一些 html。 HTML 看起来像:
<td valign="top">first text field<br>second text field</td>
不,break 标签没有在任何地方关闭。
element.text
returns 两个中的第一个,element.xpath('string()')
returns 都没有 \n
或其他分隔符。
我想我可以只解析两次,如果我只想要第二个文本字段,"subtract" 可以从后者解析前者,但这并不理想。我想一定有其他方法可以获取第二个文本字段,但我很困惑。
自己回答。 element.xpath('text()')
returns 我正在寻找的两个东西的数组。