使用 subprocess.Popen 将 pdf 文件转换为图像后如何提取第一页

Question

我正在尝试将 pdf 文件转换为图像，并且我正在使用子进程进行转换。现在我需要一种方法来只提取第一页而不必转换所有图像。在这种情况下，例如我只需要转换“out-1.png”。

我到底需要什么才能完成这项工作？这是我目前使用的代码：

import subprocess

PDFTOPPMPATH = r"C:\Program Files\poppler-0.68.0\bin\pdftoppm.exe"
PDFFILE = r"C:\Users\user\Desktop\CO880\Click_CLI\Wikibot\report(7).pdf"
subprocess.Popen('"%s" -png "%s" out' % (PDFTOPPMPATH, PDFFILE))

注意：我无意使用 pdf2image，因为我发现它有一些错误。

Answer 1

查看 '"%s" -png "%s" out' 后，我发现我可以传递额外的参数来获取第一页。传递的第一个参数是-f <int>，指定要转换的第一个页面；但是，您还必须传递 -l <int> 以指定要转换的最后一页。所以最终，我通过将最后一行编辑为： subprocess.Popen('"%s" -png "%s" out -f 1 -l 1' % (PDFTOPPMPATH, PDFFILE))

使用 subprocess.Popen 将 pdf 文件转换为图像后如何提取第一页

how to extract 1st page after converting a pdf file to an image with subprocess.Popen

python

subprocess