TypeError: expected string or bytes-like object
TypeError: expected string or bytes-like object
我写了一个 script 来解析 html 并仅打印文本内容。我想忽略标签。但是我的程序有问题。我不确定它是什么。请帮助我。
import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"
def hi():
dep = urllib.request.urlopen(url)
soup = BeautifulSoup(dep, 'html.parser')
for link in soup.find_all('p', string=True):
result = re.sub(b'<.*?>', "", link)
print (result)
hi()
网站link.
我相信,您在 link
变量中有 NavigableString
。
强制转换成如下字符串:
for link in soup.find_all('p', string=True):
result = re.sub(b'<.*?>', "", str(link))
print (result)
我写了一个 script 来解析 html 并仅打印文本内容。我想忽略标签。但是我的程序有问题。我不确定它是什么。请帮助我。
import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"
def hi():
dep = urllib.request.urlopen(url)
soup = BeautifulSoup(dep, 'html.parser')
for link in soup.find_all('p', string=True):
result = re.sub(b'<.*?>', "", link)
print (result)
hi()
网站link.
我相信,您在 link
变量中有 NavigableString
。
强制转换成如下字符串:
for link in soup.find_all('p', string=True):
result = re.sub(b'<.*?>', "", str(link))
print (result)