如何从此标签中获取所有文本?
How do I get all text from within this tag?
我试图从这个 HTML 标签中获取所有文本,我将其存储在变量 tag
:
中
<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> & His Orchestra</td>
结果应该是"Glenn Miller & His Orchestra"
。
但是 print
ing tag.find(text=True)
returns 这个:"Glenn Miller"
。
如何获取 td
元素中的其余文本?
tag.find(text=True)
将 return 第一个匹配的文本节点 。使用 .get_text()
代替:
>>> from bs4 import BeautifulSoup
>>> data = '<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> & His Orchestra</td>'
>>> soup = BeautifulSoup(data, "html.parser")
>>> tag = soup.td
>>> tag.get_text()
'Glenn Miller & His Orchestra'
我试图从这个 HTML 标签中获取所有文本,我将其存储在变量 tag
:
<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> & His Orchestra</td>
结果应该是"Glenn Miller & His Orchestra"
。
但是 print
ing tag.find(text=True)
returns 这个:"Glenn Miller"
。
如何获取 td
元素中的其余文本?
tag.find(text=True)
将 return 第一个匹配的文本节点 。使用 .get_text()
代替:
>>> from bs4 import BeautifulSoup
>>> data = '<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> & His Orchestra</td>'
>>> soup = BeautifulSoup(data, "html.parser")
>>> tag = soup.td
>>> tag.get_text()
'Glenn Miller & His Orchestra'