通过Apache PDFBox将pdf转换为word|电子爱好者

admin管理员组
文章数量:1593159

Apache PDFBox 库是一个开源、用于操作 PDF 文档的 Java 工具库。PDFBox 允许创建新的 PDF 文档、操作现有文档，以及从文档中提取内容。

获取 Apache PDFBox 下载地址，目前版本 2.0.25，核心 jar 是 pdfbox-2.0.25.jar，其他还有几个 jar 可以根据需要进行导入。

这里 jar包下载与源码学习可以下载全部的 jar 和一些命令行工具，下载 pdfbox-2.0.25-src.zip 源码可以看到文件夹 examples 里面有不少例子进行了示范。

所需jar包下载无需积分
pdf实现图片与pdf互相转换以及pdf的拆分与合并
代码下载,如果懒得下载jar包的话
如果帮助到你了麻烦点个赞或收藏哦,会不断更新的

pdf转换为word

package pdfUtity;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.*;

/**
 * @author: Serendipity
 * Date: 2022/3/17 10:58
 * Description:
 */
public class pdfToWord {
    public static void main(String[] args) {
        try {
            //输入pdf的路径
            String pdfFile = "d://desktopfile//pdfs//1.pdf";
            //将pdf加载到对象中去
            PDDocument doc = PDDocument.load(new File(pdfFile));
            //得到pdf的页数
            int pagenumber = doc.getNumberOfPages();
            //设置转换后的名字
//            pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
//            String fileName = pdfFile + ".doc";
            String fileName="word.doc";
            File file = new File(fileName);
            if (!file.exists()) {
                file.createNewFile();
            }
            FileOutputStream fos = new FileOutputStream(fileName);
            //设置输出字符集为UTF-8 因此该word应该使用UTF-8格式打开 如果你出现乱码那么你可以自己修改一下这里的格式
            Writer writer = new OutputStreamWriter(fos, "UTF-8");
            PDFTextStripper stripper = new PDFTextStripper();
            stripper.setSortByPosition(true);// 排序
            stripper.setStartPage(1);// 设置转换的开始页
            stripper.setEndPage(pagenumber);// 设置转换的结束页
            stripper.writeText(doc, writer);
            writer.close();
            doc.close();
            System.out.println("pdf转换word成功！");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

本文标签：转换为 PDFBox Apache word PDF

版权声明：本文标题：通过Apache PDFBox将pdf转换为word 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728165016a1147915.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

word转换---docx转pdf，【node】docx-pdf、LibreOffice，office-to-pdf【python】Win32com、python-docx

2小时前

提示：node版本18.18.1 ,python版本3.11.5 文章目录 [TOC](文章目录) 前言一、docx-pdf【node】二、安装依赖应用程序--LibreOffice三、exec执行cmd命令【node

php这么把pdf转为world,php pdf如何转word

2小时前

php pdf转word的方法：首先找到一个PDF文件；然后通过PdfParser解析pdf文件；最后使用“PHPOfficePHPWord”将pdf转化为word即可。

将加密的pdf转化成word

2小时前

1、pdf文件有（安全）后缀，因为加密了，无法进行修改。 2、下载pdf密码移除和pdf2Word两个软件链接：https:

如何利用python将pdf文档转为word？

2小时前

1.前言有些时候，我们需要将pdf文档转换为word文档进行处理，但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员，如何才能实现pdf转word自由&a

利用python3将word批量转换成pdf

2小时前

因为自己的作业需要把80个word文档转换成pdf格式，找了下网上现成的批量转换工具基本都是收费的，自己又懒得一个一个转，网上找了下发现很多都是python2写的&#

PDF如何转化成Word文档？看完学会转换

2小时前

PDF如何转化成Word文档？在数字化办公和学习的日常中，PDF文档因其出色的稳定性和跨平台兼容性而广受欢迎。然而，当我们需要编辑或修改PDF中的内容时&#xff0c

不花钱的PDF转Word神器！这6个真的很惊艳！

2小时前

市场上大多数PDF转Word工具都需要付费，今天我为大家推荐6款免费的PDF转Word神器，让你轻松实现文件格式的转换。 1. 懒人办公官网（lanren.work&

Java开发中Word转PDF文件5种方案横向评测

2小时前

Java开发中Word转PDF文件5种方案横向评测前段时间接了个项目，需要各种处理Word模板、转PDF、签章等等，非常头疼，其中光是一个word转PDF就折磨我好久&a

如何将PDF转Word文档

2小时前

如何将pdf转word文档前言一、格式工厂下载二、PDF转Word文档前言突然记起大学时期，想要进行论文翻译时，在网上各种找pdf转word文档的工具，最终还是没找到

如何在电脑上pdf格式转换word格式

2小时前

如何在电脑上pdf格式转换word格式？大家都知道，pdf是目前电脑上使用频率较高的文件格式，但是关于pdf文件的争议也比较的多，有的人喜欢也有不少人不

2023 年 10 款最好的免费 PDF 到 WORD 转换器

2小时前

PDF 到 Word 转换器允许将 PDF 文档“转换”为 Word 格式，而无需进行冗长复杂的操作。此类软件还可以保持原始文件的完整性。出于这个原因，许多经常使用上述文件格式的人正在寻找一个将

【软件操作】Office将Word文档转换为PDF格式

2小时前

一、问题描述 PDF格式（Portable Document Format）相比于Word文档（.doc.docx格式）体积更大&#xff0

word转化为pdf android,如何将Word转化为PDF？

2小时前

电脑怎么把Word转成PDF？大家在学习办公的过程中经常需要将Word文档转为PDF文件，但是网上相关的软件和工具的质量不一而足，我们该如何正确的选择工具来实现Word转PD

pdf怎么转换成word格式不变？

2小时前

pdf怎么转换成word格式不变？对于pdf文件大家并不陌生，不管是在工作还是在学习中，都会接触到它，它俨然已经成为最重要的电脑文件格式。使用pdf文件

java将Word或Excel转换成PDF

2小时前

将Word或Excel转换成PDF 使用1.jacob的方式进行Word转为PDF 使用Jacob需要因为Jacob的jar包如果是maven的话我这是使用的私服的形式进行引用的。然后还需要将jacob版本对应的ddl文件放到jdk或

VBA实现PDF批量转Word

2小时前

平常工作中涉及到需要将PDF转成WORD格式方便后续的数据处理。使用VBA可以很容易实现。实现的过程如下： 1.设计一个文件包，如下所示意。2.使用WORD作为实现的操作界面&#xf

免费PDF转Word？有这几个网站就够了。

2小时前

还在为PDF转换而烦恼？，几个网址，分分钟搞定。 1、PDF派 https:www.pdfpai 输入网址，进入界面会看到很多小工具&

Java将PDF文件转为Word文档

2小时前

Java将PDF文件转为Word文档一、创建Springboot Maven项目二、导入依赖信息 <repositories><repository><id>com.e-iceblue<id

vue PDF或Word转换为HTML并保留原有样式

2小时前

方法一要将PDF或Word转换为HTML并保留原有样式，可以使用pdfjs-dist和mammoth.js这两个库。首先需要安装这两个库： npm install pdfjs-dist ma

电子爱好者 - 最新技术资讯及电子产品介绍！

通过Apache PDFBox将pdf转换为word

pdf转换为word

更多相关文章

word转换---docx转pdf，【node】docx-pdf、LibreOffice，office-to-pdf【python】Win32com、python-docx

php这么把pdf转为world,php pdf如何转word

将加密的pdf转化成word

如何利用python将pdf文档转为word？

利用python3将word批量转换成pdf

PDF如何转化成Word文档？看完学会转换

不花钱的PDF转Word神器！这6个真的很惊艳！

Java开发中Word转PDF文件5种方案横向评测

如何将PDF转Word文档

如何在电脑上pdf格式转换word格式

2023 年 10 款最好的免费 PDF 到 WORD 转换器

【软件操作】Office将Word文档转换为PDF格式

word转化为pdf android,如何将Word转化为PDF？

pdf怎么转换成word格式不变？

java将Word或Excel转换成PDF

VBA实现PDF批量转Word

免费PDF转Word？有这几个网站就够了。

Java将PDF文件转为Word文档

vue PDF或Word转换为HTML并保留原有样式

推荐一个高效率的将Word转化为Pdf的通用接口，开发者免费可用

发表评论

推荐文章

sql server2008密钥,sql server 2008 r2 序列号密钥

联想电脑开机进入启动设备选择列表的热键是F12（或Fn+F12）。——我的联想台式电脑是按F12键

平板电脑服务器的安装系统安装,平板电脑安装win8系统的具体方法

The Shawshank Redemption-7

激活windows 7 RTM方法

热门文章

不得不面对的随机MAC问题

如何临时发布部署Cocos小游戏到Linux服务器，让别人能在微信打开

换到linux系统切换分辨率后，显示器输入不支持，input not support

qq设置透明头像

IDEAPhpstorm正版安装与激活（专业、详细，亲测可用）

L203 词汇题

02-07GRE真题及答案解析整理

IDM2024破解版 Internet Download Manager中文破解版 绿色版Internet Download Manager IDM下载激活教程

福昕pdf阅读器的划词翻译功能如何添加（图文并茂）

邮件大师 for linux,linux下如何安装邮件系统postfix?linux下如何对邮件系统postfix设置?,大师求解答...

最新文章

七彩虹隐星P16 2023款笔记本电脑原装Win11系统镜像下载

LENOVO联想笔记本电脑ThinkBook 15 G5 ABP(21JF)原装Win11系统,原厂OEM预装系统镜像

Alienware外星人笔记本电脑15 R317 R3原装出厂Win10系统恢复原厂OEM专用预装系统

Win10 ISO 镜像文件之SXS资源下载：解决.Net3.5安装难题的利器

史上最好用的win11镜像文件，没有之一！

ThinkPad P15v G1,T15p G1(20TR,20TM,20TQ,20TN)原厂oem自带的预装Win10系统安装包

Windows 10 on ARM, version 22H2 (updated Jul 2024) ARM64 AArch64 中文版、英文版下载

lenvo联想笔记本小新Air-14 2020 AMD ARE版(81YN)原装出厂Windows10系统镜像

lenovo联想笔记本ThinkBook 14 Gen5+ IRH(21HW)原装Win11系统镜像原厂OEM恢复出厂状态

win10创建新账户_Win10原版系统安装教程，简单易学

Lenovo联想ThinkBook 14 Gen5+ IRH(21HW)原装Win11系统镜像

如何获取win10安装驱动

xps13裸机安装win10

win10 iso安装包中的两个setup.exe如何使用

win10系统镜像

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

IDM2024破解版 Internet Download Manager中文破解版绿色版Internet Download Manager IDM下载激活教程

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载