使用美丽的汤搜索日期范围
Searching a date range using beautiful soup
我正在尝试使用 beautiful soup 从网站 https://apod.nasa.gov/apod/archivepix.html 下载图片。这是具体代码:
def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
urls.append(result['href'])
我的问题是:每次我运行代码下载所有图片(70,000 多张)。如何使用 findAll 将日期范围限制为 100 或日期之间?非常感谢任何帮助。
您可以使用限制参数
results = ...findAll('a', limit=100)
我正在尝试使用 beautiful soup 从网站 https://apod.nasa.gov/apod/archivepix.html 下载图片。这是具体代码:
def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
urls.append(result['href'])
我的问题是:每次我运行代码下载所有图片(70,000 多张)。如何使用 findAll 将日期范围限制为 100 或日期之间?非常感谢任何帮助。
您可以使用限制参数
results = ...findAll('a', limit=100)