【pdf转word】基于spire和poi免费实现pdf转word功能|电子爱好者

admin管理员组
文章数量:1638920

一、maven依赖

    <repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>https://repo.e-iceblue/repository/maven-public/</url>
        </repository>
    </repositories>
    
    <dependencies>
      <!-- spire pdf转word工具 -->
        <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.pdf.free</artifactId>
            <version>5.1.0</version>
        </dependency>

        <!-- poi工具 -->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.17</version>
        </dependency>

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.17</version>
        </dependency>
    </dependencies>

二、代码示例

废话不多说，直接上代码：

/**
 * pdf转word工具类
 */
public class Pdf2WordUtils {

    public static void main(String[] args) {
        pdf2Word("D:\\Cache\\DingDing\\508076963802517505.pdf","D:\\Cache\\DingDing\\ToDocx.docx");
    }

    /**
     * pdf转word
     * @param inPath pdf路径
     * @param outPath 生成word路径
     */
    public static void pdf2Word(String inPath, String outPath) {
        // pdf转word
        doPdf2Word(inPath, outPath);

        // 清除Spire转换后文件的备注
        clearSpireComment(outPath);
    }

    private static void doPdf2Word(String inPath, String outPath) {
        PdfDocument pdf = null;

        try {
            // 创建一个 PdfDocument 对象
            pdf = new PdfDocument();

            // 加载 PDF 文件
            pdf.loadFromFile(inPath);

            // 将PDF转换为Docx格式文件并保存
            pdf.saveToFile(outPath, FileFormat.DOCX);

        }catch (Exception e) {
            e.printStackTrace();
            throw new ServiceException("pdf转word异常！");
        }finally {
            if (pdf != null) {
                pdf.close();
            }
        }
    }

    /**
     * 清除Spire转换后文件的备注
     * Evaluation Warning : The document was created with Spire.PDF for Java.
     */
    private static void clearSpireComment(String outPath) {
        InputStream is = null;
        OutputStream out = null;
        XWPFDocument xwpfDocument = null;

        try {
            is = new FileInputStream(outPath);
            xwpfDocument = new XWPFDocument(is);
            // 删除第一个元素（Spire备注）
            xwpfDocument.removeBodyElement(0);
            out = new FileOutputStream(outPath);
            xwpfDocument.write(out);
        } catch (Exception e) {
            e.printStackTrace();
            throw new ServiceException("pdf转word异常！");
        } finally {
            try {
                if (is != null) {
                    is.close();
                }
                if (out != null) {
                    out.close();
                }
                if (xwpfDocument != null) {
                    xwpfDocument.close();
                }
            }catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

三、注意事项

有个问题需要注意一下，spire 免费版生成的 word 文档，上面会多出一行警告的文字：

所以通过这行代码（基于 poi）把警告给删掉：

// 清除Spire转换后文件的备注
clearSpireComment(outPath);

四、版本升级

最近有同学反馈只能免费转10页，升级下 spire 版本就行，我这边用的是 9.6.2 版本。高版本的每页都会多一行警告，通过 poi 遍历删除就行。

 private void clearSpireComment(String outPath) {
        //要替换的map，key为占位符，value为要被替换的值
        Map<String, Object> map = new HashMap<>();
        map.put("Evaluation Warning : The document was created with Spire.PDF for java.", "");
        FileOutputStream fileOutputStream=null;
        XWPFDocument doc=null;
        try{
            //读取文件
            OPCPackage opcPackage = POIXMLDocument.openPackage(filePath);
            //加载文档
            doc = new XWPFDocument(opcPackage);
            doc.removeBodyElement(0);

            //获取所有段落
            List<XWPFParagraph> paragraphList = doc.getParagraphs();
            for (XWPFParagraph par : paragraphList) {
                //获取段落的文本对象
                List<XWPFRun> runs = par.getRuns();
                for (XWPFRun run : runs) {
                    //获取文本的值
                    String text = run.getText(0);
                    //遍历map
                    for (Map.Entry<String, Object> entry : map.entrySet()) {
                        //获取map的key
                        String key = entry.getKey();
                        //判断文本的值和map的key，文本中是否有和key一样的占位符
                        if (StringUtils.isNotEmpty(text) && text.indexOf(key) != -1) {
                            //获取对应key的value
                            Object value = entry.getValue();
                            //把文本的内容，key替换为value
                            text = text.replace(key, value.toString());
                            //把替换好的文本内容，保存到当前这个文本对象
                            run.setText(text, 0);
                        }
                    }
                }
            }
            File file = new File(fileOutPath);
            fileOutputStream = new FileOutputStream(file);
            doc.write(fileOutputStream);
        }catch (Exception e){
            log.error("docx文件文本替换失败",e);
        }finally {
            try {
                if(fileOutputStream!=null){
                    fileOutputStream.close();
                }
                doc.close();
            } catch (IOException e) {
                log.error("docx文件文本替换失败",e);
            }
        }

    }

本文标签：功能 word PDF poi spire

版权声明：本文标题：【pdf转word】基于spire和poi免费实现pdf转word功能内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729280818a1194011.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

如何把PDF转换成word呢?

2小时前

对于我们这些办公人员来说，都知道Word格式的文档可编辑性很强，我们修改或者添加内容都很方便，但是PDF格式的文档就不一样了。这是一个兼容性很强但很难编辑的文件。所以当我们需

如何使用ilovepdf将PDF转换成word？

2小时前

我们在办公或学习过程中经常会遇到需要PDF编辑内容的情况，但PDF修改起来特别麻烦，那么这个时候就需要用到PDF转Word。那么，如何将pdf怎么转换成word&#x

java adobe pdf转word_adobe reader如何把PDF转换成word？adobe reader把PDF转换成word教程

2小时前

adobe reader如何把PDF转换成word？pdf是一种很便携的文档，不过我们一般处理编辑文档用的都是Word办公软件，那么能不能把pdf文件转换成word文档呢&a

有哪些免费的方法可以将PDF转换成Word？

2小时前

随着电子文档的普及，PDF和Word作为两种常用的文件格式，经常需要在它们之间进行转换。特别是在需要将PDF中的文本内容编辑或修改时，将其转换为Word格式成为了一种常见的需

pdf转word，一键搞定：发现这4个免费的办公神器

2小时前

PDF文件因为哪儿都能用、不容易改，大家都不喜欢。以前要把这些PDF文字弄到Word里编辑，用老办法复制粘贴，真是让人头疼。今天，咱们就一块儿学学怎么用

【pdf转word】基于spire和poi免费实现pdf转word功能

2小时前

目录一、maven依赖二、代码示例三、注意事项四、版本升级一、maven依赖 <repositories><repository><id>com.e-iceblue<id><url

pdf在线转换成word免费版，一键免费转换

2小时前

在日常的学习和办公中，PDF文件和Word文档是我们离不开的两种最常见的文件，而PDF与Word文档之间的转换成为了我们日常工作中不可或缺的一部分。无论是为了编辑、修改还是共享文件&#xf

pdf转换工具(pdf转word、xls等)

2小时前

软件背景 wps那些转换要充会员(擦没忍住，买了wps会员了，有会员真香，还用这吊东西)，所以写了个转换工具，可以把pdf转成do

word文档通配符换行_PDF如何转化成Word文档？

2小时前

对于研究生来说，写论文就是家常便饭，但是我们常常会出现需要把PDF转Word文档的时候。那么针对于这个问题我们应该怎么办呢？今天就给大家分享PDF转Word文档的方法。 PD

PDF无损转word

2小时前

pdf转word可编辑百分百还原文件 1.下载三方jar包下载jar包的地址 2.代码破解水印和页数限制 1.引入依赖 <dependency><groupId>org

Aspose.PDF For JAVA PDF转换WORD

2小时前

Aspose.PDF For JAVA PDF转换WORD 用Aspose.PDF For JAVA 把PDF转换WORD Document docnew Document(dataDir"Test.pdf")

如何把pdf转换成word软件在线

2小时前

如何把pdf转换成word软件在线由于PDF文件格式具备良好的视觉阅读性和浏览性，使得互联网开始转型将PDF作为存储文件内容的主要格式，但我们往往想要提出某些资料到Word文本中进行二次编辑&a

office竟然可以直接PDF转Word？这个“锅”请wps来背！

2小时前

WPS和Office都是非常出色的办公软件，它们都能够满足我们日常办公的需求。然而，作为一款国产办公软件，WPS在功能集成和操作上更加符合中国人的使用习惯&#xff0

推荐一款强大的PDF转Word工具：pdf2word

2小时前

推荐一款强大的PDF转Word工具：pdf2word pdf2word60行代码实现多线程PDF转Word项目地址:https:gitcodegh_mirrorspdpdf2word在日常的工作和学习中

java 转换word doc docx 等office文档为pdf，无需破解 aspose ，无水印

2小时前

我的目标：在浏览器页面上直接预览word,excel,pdf 等为何会有该需求？踩过的坑：解决思路1： 用收费版的aspose或者 spire doc

怎样把OFD转换成word？手把手教你转换

2小时前

小伙伴们有听说过OFD文件吗？这是为了解决党委机关和政府部门电子公文格式不统一，而制定的版式文档国家标准，属于我国的一种自主格式。不过由于目前使用群体没那么广泛&#x

如何将pdf转换成word在线转换

2小时前

如何将pdf转换成word在线转换绝大多数公司习惯以PDF格式存放文件和资料，PDF文档的不可编辑性，倘若要从里面提取资料确实不是一件容易的事，况且大部分的PDF文件是加密

Java：pdf转word

2小时前

转换思路使用第三方库Spire的免费版本，转换页数要求11页输入一个pdf时候，小于11页直接转换，大于11页就先切分成子pdf对每一个小的pdf进行转换&#xf

免费实用的pdf转换成word

2小时前

PDF怎么转换成Word?这是不少网友经常遇到的难题，由于PDF文件并非是一种简单容易的文档格式，因而大家在网上找到的一些方法和教程，并不能完全解决问题。笔者有着长期的文档处

pdf在线转换成word官方免费版

2小时前

pdf在线转换成word官方免费版 PDF是大家经常接触的文档格式，与PDF相关的文档格式转换是大家常需要的功能，特别是PDF转换成Word的功能，如使用桌面软件较为麻烦&a

电子爱好者 - 最新技术资讯及电子产品介绍！

【pdf转word】基于spire和poi免费实现pdf转word功能

目录

一、maven依赖

二、代码示例

三、注意事项

四、版本升级

更多相关文章

如何把PDF转换成word呢?

如何使用ilovepdf将PDF转换成word？

java adobe pdf转word_adobe reader如何把PDF转换成word？adobe reader把PDF转换成word教程

有哪些免费的方法可以将PDF转换成Word？

pdf转word，一键搞定：发现这4个免费的办公神器

【pdf转word】基于spire和poi免费实现pdf转word功能

pdf在线转换成word免费版，一键免费转换

pdf转换工具(pdf转word、xls等)

word文档通配符换行_PDF如何转化成Word文档？

PDF无损转word

Aspose.PDF For JAVA PDF转换WORD

如何把pdf转换成word软件在线

office竟然可以直接PDF转Word？这个“锅”请wps来背！

推荐一款强大的PDF转Word工具：pdf2word

java 转换word doc docx 等office文档 为pdf，无需破解 aspose ，无水印

怎样把OFD转换成word？手把手教你转换

如何将pdf转换成word在线转换

Java：pdf转word

免费实用的pdf转换成word

pdf在线转换成word官方免费版

发表评论

推荐文章

163的邮箱怎么注册？163的邮箱格式怎么填写？

【Android】Class ‘XXX‘ must either be declared abstract or implement abstract mathod ‘xxx‘ in ‘xxx‘

学习SpringBoot配置ShiroConfig报错-The security manager does not implement the WebSecurityManager interface

galgame安卓_【冷月白狐游戏】这款恋爱游戏好虐心秋之回忆4| 安卓游戏~

Information:java: Errors occurred while compiling module

热门文章

无学校邮箱的情况下学生免费申请jetbrains账号

Vbox遇到“Destination host unreachable“问题的解决之法

From 192.168.1.xxx icmp_seq=1 Destination Host Unreachable

UEFI 模式下重新安装系统注意事项

C++学习 | C++ Implement的使用 | 消除 warning C4251 | 精简库接口

安卓设备数据彻底删除指南

bat-基本语法

Linux防火墙之iptables

点互信息PMI（Pointwise Mutual Information）

VMware虚拟机无法识别USB设备：USB摄像头、U盘等

最新文章

没花一分钱的我竟然收到的JetBrains IDEA官方免费赠送一年的Licence

android tf卡及u盘_android8.1系统修改第三方app无法读写U盘或者内部SD卡的问题

【麒麟系统图形化界面安装（可解决U盘无法可视化显示问题】

电脑是如何识别USB 3.0 U盘的

android 7.1.2不能读u盘的解决办法

从小白开始学习Java 第一期

Linux U盘分区和文件系统识别和挂载

解决IMX6从 uboot调试usb start 命令无法识别U盘的问题

新唐NUC980读取U盘配置

Windows 10中无法读取插入U盘的解决方案

IntelliJ IDEA的安装教程（超详细）

redhat kvm 虚拟机U盘不识别的解决办法

u盘不能被识别，需要手动重新挂载U盘

【刷机】进入FastBoot后，无法识别设备

android 读取U盘

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

java 转换word doc docx 等office文档为pdf，无需破解 aspose ，无水印

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载