Apache PDFBox 提取 pdf 某一页另存为图片
时间:2019-11-29 13:09:18|栏目:|点击: 次
Apache PDFBox 库是一个开源、用于操作 PDF 文档的 Java 工具库。PDFBox 允许创建新的 PDF 文档、操作现有文档,以及从文档中提取内容。本文介绍演示了从现有的 PDF 提取某个页面,另存为 png 的操作。
package com.codeinn.pdf.test; import java.awt.image.BufferedImage; import java.io.File; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.rendering.ImageType; import org.apache.pdfbox.rendering.PDFRenderer; import org.apache.pdfbox.util.ImageIOUtil; public class PdfBox2ImgEx { public static void main(String[] args){ try{ PDDocument pdfDocument = PDDocument.load(new File("KELLWOOD01.pdf")); int iPages = pdfDocument.getNumberOfPages(); PDFRenderer pdfRenderer = new PDFRenderer(pdfDocument); int dpi = 300; for(int iPage=0;iPage<iPages;iPage++){ BufferedImage buffImage = pdfRenderer.renderImageWithDPI(iPage, dpi, ImageType.RGB); ImageIOUtil.writeImage(buffImage, "KELLWOOD01_"+iPage+".png", dpi); } pdfDocument.close(); } catch (Exception e){ } } }