在 Python 中自动从特定网站下载 cdf 文件

Automatically download cdf files from specific website in Python

我想创建一个可以从该网站下载特定 CDF 文件的程序:

http://research.ssl.berkeley.edu/data/psp/data/sci/fields/l2/mag_RTN_4_Sa_per_Cyc/2018/10/

例如,我希望系统询问用户他想下载哪个具体日期以及下载文件并将其存储为数据的程序。

本站所有文件名都以日期结尾。例如:

psp_fld_l2_mag_RTN_4_Sa_per_Cyc_20181003_v01.cdf

其中,20181003 表示 2018/10/03(日期)

这可能吗?

因为这是一个静态网站并且不涉及 javascript 加载文件,您可以继续请求从 url 获取 html 使用 r = requests.get(url)

然后您可以继续使用 beautifulsoup 的网络抓取获取所有链接,最后使用

保存文件

r = requests.get(fetched_url,allow_redirects=True)

open(filename,'wb').write(r.content)