以下内容将介绍如何通过Java程序来读取或提取PDF中的图片。
工具/原料
Free Spire.PDF for Java 2.4.4(免费版)
jar文件导入
1、方法1:通过官网下载(https://www.e-i罕铞泱殳ceblue.cn/Introduce/Free-Spire-PDF-JAVA.html)。下载包-解压,复制文件夹lib中的jar文件(如下图);在程序中新建一个directory目录,并命名,同时将jar文件复制到此目录下;选中复制后的jar文件,点击鼠标右键,选择“Add as Library”。完成引用。
2、方法2:通过maven导入。参考导入方法(https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html)
Java代码示例
1、import com.spire.pdf.*;import javax.imageio.ImageIO;import java.awt.image.BufferedImage;import 枣娣空郅java.io.File;public class ExtractImg { public static void main(String[] args) throws Exception{ //加载测试文档 PdfDocument pdf = new PdfDocument(); pdf.loadFromFile("test.pdf"); //定义一个int型变量 int index = 0; //遍历PDF每一页 for (int i= 0;i< pdf.getPages().getCount(); i ++){ //获取PDF页面 PdfPageBase page = pdf.getPages().get(i); //使用extractImages方法获取指定页上图片 for (BufferedImage image : page.extractImages()) { //指定输出图片名称 File output = new File( String.format("Image_%d.png", index++)); //将图片保存为PNG格式 ImageIO.write(image, "PNG", output); } } }}
2、运行程序,提取图片。jar文件导入及图片提取效果如下图所示: