Regex TypeError: 'NoneType' object is not callable
Regex TypeError: 'NoneType' object is not callable
我正在尝试从网页中提取一些数据。我正在使用 Beautiful Soup 4 和正则表达式。
问题是它 returns 是一个错误,但我不知道为什么会出现错误。
这是我的一段代码:
urls = soup.findall('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))
这里是错误:
Traceback (most recent call last):
File "C:\Users\Milano\My Documents\LiClipse Workspace\Web_Crawlers\idatabaze_cz.py", line 14, in <module>
get_categories_urls()
File "C:\Users\Milano\My Documents\LiClipse Workspace\Web_Crawlers\idatabaze_cz.py", line 10, in get_categories_urls
urls = soup.findall('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))
TypeError: 'NoneType' object is not callable
至少有一个标签符合条件。
例如:<a href="/katalog/stavebnictvi/semily/">
我认为我的正则表达式有问题。我想搜索 href 采用这种形式的每个标签 a:/katalog/stavebnictvi/(any text)
有什么建议吗?
soup.findall
有问题,必须是 soup.findAll
或 soup.find_all
urls = soup.findAll('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))
我正在尝试从网页中提取一些数据。我正在使用 Beautiful Soup 4 和正则表达式。
问题是它 returns 是一个错误,但我不知道为什么会出现错误。
这是我的一段代码:
urls = soup.findall('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))
这里是错误:
Traceback (most recent call last):
File "C:\Users\Milano\My Documents\LiClipse Workspace\Web_Crawlers\idatabaze_cz.py", line 14, in <module>
get_categories_urls()
File "C:\Users\Milano\My Documents\LiClipse Workspace\Web_Crawlers\idatabaze_cz.py", line 10, in get_categories_urls
urls = soup.findall('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))
TypeError: 'NoneType' object is not callable
至少有一个标签符合条件。
例如:<a href="/katalog/stavebnictvi/semily/">
我认为我的正则表达式有问题。我想搜索 href 采用这种形式的每个标签 a:/katalog/stavebnictvi/(any text)
有什么建议吗?
soup.findall
有问题,必须是 soup.findAll
或 soup.find_all
urls = soup.findAll('a',href = re.compile(r'/katalog/stavebnictvi/'+'.'))