使用美丽的汤搜索日期范围

Searching a date range using beautiful soup

我正在尝试使用 beautiful soup 从网站 https://apod.nasa.gov/apod/archivepix.html 下载图片。这是具体代码:

def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
    urls.append(result['href'])

我的问题是:每次我运行代码下载所有图片(70,000 多张)。如何使用 findAll 将日期范围限制为 100 或日期之间?非常感谢任何帮助。

您可以使用限制参数

results = ...findAll('a', limit=100)