有没有一种从外部来源收集图像文件的快速方法(Chrome 开发人员选项卡)

Is there a fast way of gathering image files from external sources (Chrome Developer Tab)

假设我访问了一个名为 abc.xyz.

的网站

当我访问该网站时,我看到该网站运行一个 javascript 脚本来创建一本交互式图书。显然,这本书必须有每一页的图像文件。

现在假设我转到开发人员工具选项卡并转到源选项卡以查找图像 - 果然,我找到了它们。但是,图像来自名为 xyz.abc 的文件夹和域,访问时显示 403 错误。

有没有比访问每个图像的 link 并单独保存每个图像更快的收集这些图像文件的方法(请记住,图像本身不受限制访问)?

现实世界的例子: Image showing files under the sources tab.

在上图中,您可以看到一个文件夹中有几个图像文件(实际上有数百个)。图像所在的域和文件夹在访问时显示 403 错误,但图像本身不受限制。要下载图像,您可以单独获取每个图像的 link 并使用“图像另存为”。但是,这对于数百张图片来说会很耗时 - 有没有更快的方法来下载所有图片?

编辑:此外,是否有一种方法可以通过 PDF 文件上预先存在的页码快速订购 PDF 图像。

要获取网页的图像,您可以使用 python 脚本来获取所有图像 src 然后您可以对其执行任何操作,例如复制它进入您的系统或进入您的网站。

我已经使用 BeautifulSoup 进行网页抓取

from bs4 import BeautifulSoup
import requests

page = requests.get("
soup = BeautifulSoup(page.content, 'html.parser')
#print(soup.prettify())
for element in soup.find_all("img"):
    try:
        print(element['src'])
    except Exception as e:
        pass