将原始 HTML 代码转换为 PDF 文件
Convert raw HTML codes to PDF File
我想将原始 html 代码转换为 pdf 文件。
这是我的控制器代码
@RequestMapping("getpdf")
public void doGet(HttpServletRequest request,
HttpServletResponse response,String ref){
OutputStream out = null;
Document document = new Document(PageSize.A4, 50, 50, 50, 50);
java.util.List items = null;
ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref));
items = new ArrayList();
items.add(abean.getArticle());
try {
response.setContentType("application/pdf");
PdfWriter.getInstance(document, response.getOutputStream());
document.open();
Paragraph paragraph = new Paragraph("Microweb Systems");
document.add(paragraph);
ListItem listItem;
com.lowagie.text.List list = new com.lowagie.text.List(true, 15);
Iterator i = items.iterator();
while(i.hasNext()) {
listItem = new ListItem((String)i.next(),
FontFactory.getFont(FontFactory.TIMES_ROMAN, 12));
list.add(listItem);
}
document.add(list);
} catch (Exception e) {
} finally {
document.close();
}
document.close();
}
它将 HTML 代码转换为 PDF,但该 pdf 还包含标签
喜欢
<h1>Hello World</h1>
有什么方法可以删除这些标签并只显示数据。
我正在通过 DTO 从数据库提供数据。
如果我理解你的问题,你想删除标签。
这可以通过 String.replaceAll(String regex, String replacement)
来完成。
例如 myString.replaceAll("^<[.]*>$" , "");
将删除任何标签。
但是,这不会使 pdf 看起来像浏览器中的页面。
我想将原始 html 代码转换为 pdf 文件。 这是我的控制器代码
@RequestMapping("getpdf")
public void doGet(HttpServletRequest request,
HttpServletResponse response,String ref){
OutputStream out = null;
Document document = new Document(PageSize.A4, 50, 50, 50, 50);
java.util.List items = null;
ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref));
items = new ArrayList();
items.add(abean.getArticle());
try {
response.setContentType("application/pdf");
PdfWriter.getInstance(document, response.getOutputStream());
document.open();
Paragraph paragraph = new Paragraph("Microweb Systems");
document.add(paragraph);
ListItem listItem;
com.lowagie.text.List list = new com.lowagie.text.List(true, 15);
Iterator i = items.iterator();
while(i.hasNext()) {
listItem = new ListItem((String)i.next(),
FontFactory.getFont(FontFactory.TIMES_ROMAN, 12));
list.add(listItem);
}
document.add(list);
} catch (Exception e) {
} finally {
document.close();
}
document.close();
}
它将 HTML 代码转换为 PDF,但该 pdf 还包含标签
喜欢
<h1>Hello World</h1>
有什么方法可以删除这些标签并只显示数据。
我正在通过 DTO 从数据库提供数据。
如果我理解你的问题,你想删除标签。
这可以通过 String.replaceAll(String regex, String replacement)
来完成。
例如 myString.replaceAll("^<[.]*>$" , "");
将删除任何标签。
但是,这不会使 pdf 看起来像浏览器中的页面。