尝试将 Python3 中的 fancyURLopener 用于 PDF,但它给了我一个 DeprecationWarning 错误
Trying to use fancyURLopener in Python3 for a PDF, but it gives me a DeprecationWarning error
我正在尝试从银行网站访问 PDF 文件以进行 PDF 挖掘,但它一直返回 HTTP 403 错误。因此,作为一种解决方法,我正在尝试将我的用户代理更改为用于访问文件(并下载文件)的浏览器。
下面的代码是我现在拥有的一部分。这个returns出现以下错误:
C:\Users\Name\Anaconda3\lib\site-packages\ipykernel_launcher.py:8: DeprecationWarning: 调用请求的 MyOpener 样式已弃用。使用较新的 urlopen functions/methods
我该如何解决这个问题?
import urllib.request
my_url = 'someurl here'
class MyOpener(urllib.request.FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11)
Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()
page = myopener.open(my_url)
page.read()
你可以试试这个:
import urllib2
def download_file(download_url):
response = urllib2.urlopen(download_url)
f = open("the_downloaded_file.pdf", 'wb')
f.write(response.read())
f.close()
download_file("some url to pdf here")
我正在尝试从银行网站访问 PDF 文件以进行 PDF 挖掘,但它一直返回 HTTP 403 错误。因此,作为一种解决方法,我正在尝试将我的用户代理更改为用于访问文件(并下载文件)的浏览器。
下面的代码是我现在拥有的一部分。这个returns出现以下错误:
C:\Users\Name\Anaconda3\lib\site-packages\ipykernel_launcher.py:8: DeprecationWarning: 调用请求的 MyOpener 样式已弃用。使用较新的 urlopen functions/methods
我该如何解决这个问题?
import urllib.request
my_url = 'someurl here'
class MyOpener(urllib.request.FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11)
Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()
page = myopener.open(my_url)
page.read()
你可以试试这个:
import urllib2
def download_file(download_url):
response = urllib2.urlopen(download_url)
f = open("the_downloaded_file.pdf", 'wb')
f.write(response.read())
f.close()
download_file("some url to pdf here")