将原始 HTML 代码转换为 PDF 文件

Convert raw HTML codes to PDF File

我想将原始 html 代码转换为 pdf 文件。 这是我的控制器代码

@RequestMapping("getpdf")
public void doGet(HttpServletRequest request, 
        HttpServletResponse response,String ref){


    OutputStream out = null;
    Document document = new Document(PageSize.A4, 50, 50, 50, 50);
    java.util.List items = null;

    ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref));
        items = new ArrayList();
        items.add(abean.getArticle());             


    try {
        response.setContentType("application/pdf");
        PdfWriter.getInstance(document, response.getOutputStream());
        document.open();
        Paragraph paragraph = new Paragraph("Microweb Systems");
        document.add(paragraph);
        ListItem listItem;
        com.lowagie.text.List list = new com.lowagie.text.List(true, 15);
        Iterator i = items.iterator();
        while(i.hasNext()) {
            listItem = new ListItem((String)i.next(), 
                    FontFactory.getFont(FontFactory.TIMES_ROMAN, 12));

            list.add(listItem);
        }
        document.add(list);

    } catch (Exception e) {

    } finally {
        document.close();
    }
    document.close();
}

它将 HTML 代码转换为 PDF,但该 pdf 还包含标签

喜欢

<h1>Hello World</h1>

有什么方法可以删除这些标签并只显示数据。

我正在通过 DTO 从数据库提供数据。

如果我理解你的问题,你想删除标签。

这可以通过 String.replaceAll(String regex, String replacement) 来完成。

例如 myString.replaceAll("^<[.]*>$" , ""); 将删除任何标签。 但是,这不会使 pdf 看起来像浏览器中的页面。