pdfbox是一款十分實用的可以用于處理PDF文檔的Java工具,它具有文本提取、合並&分割、表單填充、PDF/A驗證、PDF打印、PDF轉換等功能,非常實用,需要的朋友可以來本站下載使用!

pdfbox簡介
PDFBox(一个BSD许可下的源码开放项目)是一个开源的用于处理PDF文档的 Java工具,支持各种语言和平台的PDF工具和类库就如雨后春笋般涌现。PDFBox 提取文本,包括Unicode字符。PDFBox和Jakarta Lucene等文本搜索引擎的整合过程十分简单。加密/解密PDF文档。PDFBox从PDF和XFDF格式中导入或导出表单数据。向已有PDF文档中追加内容。将一个PDF文档切分为多个文档。
功能說明
1、文本提取:從PDF文檔中提取文本。
2、合並&分割:可以把多個PDF文檔合並成單個,也可以把單個PDF分拆成多個PDF文檔。
3、表單填充:可以從PDF表單中提取數據,或者是填充PDF表單。
4、PDF/A验证:验证PDF文档是否满足PDF/A ISO标准。
5、PDF打印:把PDF文檔輸出到打印機——利用了Java的打印API。
6、PDF轉換:可以把PDF文檔轉換成映像文件。
7、PDF創建:可以從頭創建新的PDF文檔。
8、集成Lucene搜索引擎:Lucene搜索引擎與PDF索引相集成。
更新記錄
这个版本是基于 2.0.5 版本的增量式 bug 修复版本,包含了几个修复和小改进,更新如下:
Bug 修复
[PDFBOX-3313] - Java 9 InaccessibleObjectException
[PDFBOX-3318] - IllegalArgumentException in PDPageTree constructor: root cannot be null
[PDFBOX-3347] - COSName parsing doesn't handle ISO-8859-1 encoded bytes