使用 subprocess.Popen 将 pdf 文件转换为图像后如何提取第一页

how to extract 1st page after converting a pdf file to an image with subprocess.Popen

我正在尝试将 pdf 文件转换为图像,并且我正在使用子进程进行转换。现在我需要一种方法来只提取第一页而不必转换所有图像。在这种情况下,例如我只需要转换“out-1.png”。

我到底需要什么才能完成这项工作?这是我目前使用的代码:

import subprocess

PDFTOPPMPATH = r"C:\Program Files\poppler-0.68.0\bin\pdftoppm.exe"
PDFFILE = r"C:\Users\user\Desktop\CO880\Click_CLI\Wikibot\report(7).pdf"
subprocess.Popen('"%s" -png "%s" out' % (PDFTOPPMPATH, PDFFILE))

注意:我无意使用 pdf2image,因为我发现它有一些错误。

查看 '"%s" -png "%s" out' 后,我发现我可以传递额外的参数来获取第一页。 传递的第一个参数是-f <int>,指定要转换的第一个页面;但是,您还必须传递 -l <int> 以指定要转换的最后一页。所以最终,我通过将最后一行编辑为: subprocess.Popen('"%s" -png "%s" out -f 1 -l 1' % (PDFTOPPMPATH, PDFFILE))