iText7:合并两个 pdf 时文件指针出错

iText7: Error at file pointer when merging two pdfs

我们正处于评估 iText7 的最后步骤。我们使用 iText 7.1.0 和 html2pdf 2.0.0.

我们做什么:我们将带有 pdf 数据的 json_encoded 集合(包括 html 的页眉、正文和页脚)发送到我们的 Java 应用程序。在那里我们遍历集合,为每个 pdf 数据元素创建一个 byteArrayOutputStream 并将它们合并在一起。然后我们将结果发送到一个脚本,该脚本将其回显到例如一个浏览器。虽然 pdf 显示正确,但我们在创建它时遇到错误:

    com.itextpdf.io.IOException: Error at file pointer 226,416.
    ...
    Caused by: com.itextpdf.io.IOException: xref subsection not found.
    ... 73 common frames omitted

如果我们只创建集合的一部分,则不会抛出任何错误。

遍历集合并合并:

@RequestMapping(value = "/pdf", method = RequestMethod.POST, produces = MediaType.APPLICATION_PDF_VALUE)
public byte[] index(@RequestBody PDFDataModelCollection elements, Model model) throws IOException {    
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
    PdfWriter writer = new PdfWriter(byteArrayOutputStream);
    try (PdfDocument resultDoc = new PdfDocument(writer)) {
        for (PDFDataModel pdfDataModel : elements.getElements()) {
            PdfReader reader = new PdfReader(new ByteArrayInputStream(creationService.createDatasheet(pdfDataModel)));
            try (PdfDocument sourceDoc = new PdfDocument(reader)) {
                int n = sourceDoc.getNumberOfPages(); //<-- IOException on second iteration
                for (int i = 1; i <= n; i++) {
                    PdfPage page = sourceDoc.getPage(i).copyTo(resultDoc);
                    resultDoc.addPage(page);
                }
            }
        }
    }
    return byteArrayOutputStream.toByteArray(); //outputs the final pdf
}

创建零件:

public byte[] createDatasheet(PDFDataModel pdfDataModel) throws IOException {
    PdfWriter writer = new PdfWriter(byteArrayOutputStream);

    //Initialize PDF document
    PdfDocument pdfDoc = new PdfDocument(writer);

    try (
        Document document = new Document(pdfDoc)
    ) {

        //header, footer, etc

        //body
        for (IElement element : HtmlConverter.convertToElements(pdfDataModel.getBody(), this.props)) {
            document.add((IBlockElement) element);
        }

        footer.writeTotalNumberOnPages(pdfDoc);
    }

    return byteArrayOutputStream.toByteArray();
}

我们非常感谢任何建议。

createDatasheet 中,您似乎重新使用了一些 byteArrayOutputStream 而没有先清除它。

因此,在第一次迭代中,一切都按预期运行,在 createDatasheet 结束时,您只有一个 PDF 文件。

不过,在第二次迭代中,byteArrayOutputStream 中有两个 PDF 文件,一个接一个。此串联未形成有效的单个 PDF。

因此,byteArrayOutputStream.toByteArray() returns 东西坏了。

要解决此问题,请将 byteArrayOutputStream 设置为 createDatasheet 本地并每次创建一个新实例,或者在 createDatasheet 的开头重置 byteArrayOutputStream

public byte[] createDatasheet(PDFDataModel pdfDataModel) throws IOException {
    byteArrayOutputStream.reset();
    PdfWriter writer = new PdfWriter(byteArrayOutputStream);
    [...]