BeautifulSoup - 如何 select 分隔值?

BeautifulSoup - how to select separate values?

在我的 scrapper 中,我使用 .select("div.class-name") 方法但是有一个问题:它 returns 非分隔值。

我的html结构:

<div class="class-name">
   <div>Text1</div>
   <div>Text2</div>
   <div>Text3</div>
</div>

结果它给了我一个列表 ["Text1Text2Text3"]。有没有什么办法像 html?

那样把它分开

你的意思是这样?

from bs4 import BeautifulSoup

sample_html = '''<div class="class-name">
   <div>Text1</div>
   <div>Text2</div>
   <div>Text3</div>
</div>'''

print(BeautifulSoup(sample_html, "lxml").select("div.class-name div"))

输出:

[<div>Text1</div>, <div>Text2</div>, <div>Text3</div>]