个性化阅读
专注于IT技术分析

标签:PDFBox操作

PDFBox处理元数据-srcmini
Apache PDFBox

PDFBox处理元数据

半瓶木阅读(1230)评论(0)赞(0)

本文概述 使用Setter()方法- 使用getter()方法- PDF文档具有许多属性。这些属性提供与PDF文档有关的元数据信息。由于某些字段是可选的, 因此不能保证所有PDF文件都具有我们需要的所有元数据。 PDF文档包含以下属性- 文...

PDFBox使用附件-srcmini
Apache PDFBox

PDFBox使用附件

半瓶木阅读(1587)评论(0)赞(0)

PDF文档可以包含通过文件系统对外部文件的引用或对远程位置的URL。也可以将二进制文件嵌入到PDF文档中。 Apache PDFBox提供了以下可用于引用文件的类。 Class Discription PDSimpleFileSpecifi...

PDFBox使用字体-srcmini
Apache PDFBox

PDFBox使用字体

半瓶木阅读(6825)评论(0)赞(2)

在PDFBox中, 可能需要添加具有不同字体系列和大小的文本。 PDFBox规范指出”在处理PDF文档时, 将始终提供标准的14种字体集”。在PDFBox中, 这组14种字体在PDType1Font类中定义为常量。使...

PDFBox分割PDF文件-srcmini
Apache PDFBox

PDFBox分割PDF文件

半瓶木阅读(1767)评论(0)赞(0)

本文概述 加载现有文档 创建拆分器对象 分割PDF文件 创建迭代器对象 关闭文件 Java程序 我们可以将给定的PDF文档拆分为多个PDF文件。 Splitter类可以将每个PDF文件拆分为一个单独的文件。此类用于将给定的PDF文档拆分为其...

Apache PDFBox

PDFBox合并PDF文档

半瓶木阅读(2452)评论(0)赞(0)

本文概述 加载现有文档 创建PDFMergerUtility类对象 设定目的地 设置源文件 合并PDF 关闭文件 Java程序 我们可以将多个PDF文档合并为一个PDF文件。使用PDFBox合并PDF文档并不简单。我们可以使用PDFMerg...

Apache PDFBox

PDFBox删除页面

半瓶木阅读(1192)评论(0)赞(0)

本文概述 加载PDF文档 列出页数 删除页面 保存文件 关闭文件 我们可以从现有的PDF文档中删除页面。 PDDocument类的removePage()方法用于从文档中删除页面。 请按照以下步骤从现有的PDF文档中删除页面- 载入PDF文...

Apache PDFBox

PDFBox读取文字

半瓶木阅读(2209)评论(0)赞(0)

本文概述 载入PDF文件 实例化PDFTextStripper类 检索文字 关闭文件 Java程序 PDFBox库的主要功能之一是能够快速, 准确地从现有PDF文档中提取文本。在本节中, 我们将学习如何使用Java程序从PDFBox库中的现...

PDFBox加载现有文档-srcmini
Apache PDFBox

PDFBox加载现有文档

半瓶木阅读(1027)评论(0)赞(0)

本文概述 加载现有文档 执行操作 保存文件 关闭文件 本节介绍如何加载系统中已经存在的PDF文档。通过加载现有文档, 我们可以对其执行许多操作, 例如添加文本, 删除文本, 添加图像, 删除页面等。 请按照以下步骤加载现有的PDF文档- 加...

Apache PDFBox

PDFBox将图像插入PDF文档

半瓶木阅读(1077)评论(0)赞(0)

本文概述 加载现有文档 检索页面 为PDImageXObject创建对象 准备内容流 画图 关闭PDPageContentStream 保存文件 关闭文件 PDFBox提供了一个用于将图像插入PDF文档的库。该库使用Java程序在PDF文档...

Apache PDFBox

获取图像的位置和大小

半瓶木阅读(1583)评论(0)赞(0)

本文概述 扩展PDFStreamEngine 调用processPage() 覆盖processOperator() 检查图像 打印位置和尺寸 在本教程中, 我们将学习如何从所有页面获取PDF中图像的坐标或位置以及大小。这可以通过使用PDF...