BeautifulSoup - 如何 select 分隔值?
BeautifulSoup - how to select separate values?
在我的 scrapper 中,我使用 .select("div.class-name") 方法但是有一个问题:它 returns 非分隔值。
我的html结构:
<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>
结果它给了我一个列表 ["Text1Text2Text3"]。有没有什么办法像 html?
那样把它分开
你的意思是这样?
from bs4 import BeautifulSoup
sample_html = '''<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>'''
print(BeautifulSoup(sample_html, "lxml").select("div.class-name div"))
输出:
[<div>Text1</div>, <div>Text2</div>, <div>Text3</div>]
在我的 scrapper 中,我使用 .select("div.class-name") 方法但是有一个问题:它 returns 非分隔值。
我的html结构:
<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>
结果它给了我一个列表 ["Text1Text2Text3"]。有没有什么办法像 html?
那样把它分开你的意思是这样?
from bs4 import BeautifulSoup
sample_html = '''<div class="class-name">
<div>Text1</div>
<div>Text2</div>
<div>Text3</div>
</div>'''
print(BeautifulSoup(sample_html, "lxml").select("div.class-name div"))
输出:
[<div>Text1</div>, <div>Text2</div>, <div>Text3</div>]