有没有一种从外部来源收集图像文件的快速方法（Chrome 开发人员选项卡）

Question

假设我访问了一个名为 abc.xyz.

的网站

当我访问该网站时，我看到该网站运行一个 javascript 脚本来创建一本交互式图书。显然，这本书必须有每一页的图像文件。

现在假设我转到开发人员工具选项卡并转到源选项卡以查找图像 - 果然，我找到了它们。但是，图像来自名为 xyz.abc 的文件夹和域，访问时显示 403 错误。

有没有比访问每个图像的 link 并单独保存每个图像更快的收集这些图像文件的方法（请记住，图像本身不受限制访问）？

现实世界的例子： Image showing files under the sources tab.

在上图中，您可以看到一个文件夹中有几个图像文件（实际上有数百个）。图像所在的域和文件夹在访问时显示 403 错误，但图像本身不受限制。要下载图像，您可以单独获取每个图像的 link 并使用“图像另存为”。但是，这对于数百张图片来说会很耗时 - 有没有更快的方法来下载所有图片？

编辑：此外，是否有一种方法可以通过 PDF 文件上预先存在的页码快速订购 PDF 图像。

Answer 1

要获取网页的图像，您可以使用 python 脚本来获取所有图像 src 然后您可以对其执行任何操作，例如复制它进入您的系统或进入您的网站。

我已经使用 BeautifulSoup 进行网页抓取

from bs4 import BeautifulSoup
import requests

page = requests.get("
soup = BeautifulSoup(page.content, 'html.parser')
#print(soup.prettify())
for element in soup.find_all("img"):
    try:
        print(element['src'])
    except Exception as e:
        pass

有没有一种从外部来源收集图像文件的快速方法（Chrome 开发人员选项卡）

Is there a fast way of gathering image files from external sources (Chrome Developer Tab)

download

google-chrome-devtools