使用 subprocess.Popen 将 pdf 文件转换为图像后如何提取第一页
how to extract 1st page after converting a pdf file to an image with subprocess.Popen
我正在尝试将 pdf 文件转换为图像,并且我正在使用子进程进行转换。现在我需要一种方法来只提取第一页而不必转换所有图像。在这种情况下,例如我只需要转换“out-1.png”。
我到底需要什么才能完成这项工作?这是我目前使用的代码:
import subprocess
PDFTOPPMPATH = r"C:\Program Files\poppler-0.68.0\bin\pdftoppm.exe"
PDFFILE = r"C:\Users\user\Desktop\CO880\Click_CLI\Wikibot\report(7).pdf"
subprocess.Popen('"%s" -png "%s" out' % (PDFTOPPMPATH, PDFFILE))
注意:我无意使用 pdf2image,因为我发现它有一些错误。
查看 '"%s" -png "%s" out'
后,我发现我可以传递额外的参数来获取第一页。
传递的第一个参数是-f <int>
,指定要转换的第一个页面;但是,您还必须传递 -l <int>
以指定要转换的最后一页。所以最终,我通过将最后一行编辑为:
subprocess.Popen('"%s" -png "%s" out -f 1 -l 1' % (PDFTOPPMPATH, PDFFILE))
我正在尝试将 pdf 文件转换为图像,并且我正在使用子进程进行转换。现在我需要一种方法来只提取第一页而不必转换所有图像。在这种情况下,例如我只需要转换“out-1.png”。
我到底需要什么才能完成这项工作?这是我目前使用的代码:
import subprocess
PDFTOPPMPATH = r"C:\Program Files\poppler-0.68.0\bin\pdftoppm.exe"
PDFFILE = r"C:\Users\user\Desktop\CO880\Click_CLI\Wikibot\report(7).pdf"
subprocess.Popen('"%s" -png "%s" out' % (PDFTOPPMPATH, PDFFILE))
注意:我无意使用 pdf2image,因为我发现它有一些错误。
查看 '"%s" -png "%s" out'
后,我发现我可以传递额外的参数来获取第一页。
传递的第一个参数是-f <int>
,指定要转换的第一个页面;但是,您还必须传递 -l <int>
以指定要转换的最后一页。所以最终,我通过将最后一行编辑为:
subprocess.Popen('"%s" -png "%s" out -f 1 -l 1' % (PDFTOPPMPATH, PDFFILE))