class 使用 Beautifulsoup 的正则表达式
Regular expression for class using Beautifulsoup
我正在使用 BeautifulSoup 方便抓取。
我发现网页中有超过 5 个 div
我想删除。他们的名字不同但有规律。
这些 div 是:
divnewthing
divnew
divnewstring
等等
所以模式是 divnew*
种正则表达式。
我正在使用:
soup.find('div', {"class": "divnew"})
目前。
我想以某种方式使用正则表达式。有人可以帮我吗?
是的,你也可以传递 regular expression pattern:
soup.find('div', {"class": re.compile("^divnew")})
或者,一个函数,检查 class 名称是否以 divnew
:
开头
soup.find('div', {"class": lambda x: x and x.startswith("divnew"))})
或者,CSS selector:
soup.select("div[class^=divnew]")
我正在使用 BeautifulSoup 方便抓取。
我发现网页中有超过 5 个 div
我想删除。他们的名字不同但有规律。
这些 div 是:
divnewthing
divnew
divnewstring
等等
所以模式是 divnew*
种正则表达式。
我正在使用:
soup.find('div', {"class": "divnew"})
目前。
我想以某种方式使用正则表达式。有人可以帮我吗?
是的,你也可以传递 regular expression pattern:
soup.find('div', {"class": re.compile("^divnew")})
或者,一个函数,检查 class 名称是否以 divnew
:
soup.find('div', {"class": lambda x: x and x.startswith("divnew"))})
或者,CSS selector:
soup.select("div[class^=divnew]")