Beautiful Soup - 获取没有嵌套跨度的顶级 div 标签
Beautiful Soup - Getting top div tag without nested span
我只需要获取最上面的 div 标签,而不需要其嵌套标签。
<div class="listing-price">
K75,000
<span class="listing-price-sqm">0000/m<sup>2</sup></span>
</div>
我的代码 returns 来自 div class 标签和跨度 class 标签的值:
listing_price = house.find("div", class_="listing-price").text.strip()
我怎样才能得到 K75,000 的价值?
谢谢
您可能想试试这个:
soup.find('div', {'class': 'listing-price'}).get_text(strip=True, separator='|').split('|')[0]
您可以使用 contents
或 next_element
来获取值。
html='''<div class="listing-price">
K75,000
<span class="listing-price-sqm">0000/m<sup>2</sup></span>
</div>'''
soup=BeautifulSoup(html,"html.parser")
print(soup.select_one(".listing-price").contents[0].strip())
或
print(soup.select_one(".listing-price").next_element.strip())
输出:
K75,000
我只需要获取最上面的 div 标签,而不需要其嵌套标签。
<div class="listing-price">
K75,000
<span class="listing-price-sqm">0000/m<sup>2</sup></span>
</div>
我的代码 returns 来自 div class 标签和跨度 class 标签的值:
listing_price = house.find("div", class_="listing-price").text.strip()
我怎样才能得到 K75,000 的价值?
谢谢
您可能想试试这个:
soup.find('div', {'class': 'listing-price'}).get_text(strip=True, separator='|').split('|')[0]
您可以使用 contents
或 next_element
来获取值。
html='''<div class="listing-price">
K75,000
<span class="listing-price-sqm">0000/m<sup>2</sup></span>
</div>'''
soup=BeautifulSoup(html,"html.parser")
print(soup.select_one(".listing-price").contents[0].strip())
或
print(soup.select_one(".listing-price").next_element.strip())
输出:
K75,000