class 使用 Beautifulsoup 的正则表达式

Regular expression for class using Beautifulsoup

我正在使用 BeautifulSoup 方便抓取。

我发现网页中有超过 5 个 div 我想删除。他们的名字不同但有规律。

这些 div 是:

divnewthing
divnew
divnewstring

等等

所以模式是 divnew* 种正则表达式。

我正在使用:

soup.find('div', {"class": "divnew"})

目前。

我想以某种方式使用正则表达式。有人可以帮我吗?

是的,你也可以传递 regular expression pattern:

soup.find('div', {"class": re.compile("^divnew")})

或者,一个函数,检查 class 名称是否以 divnew:

开头
soup.find('div', {"class": lambda x: x and x.startswith("divnew"))})

或者,CSS selector

soup.select("div[class^=divnew]")