【python】pdf转png；pdf转word|电子爱好者

admin管理员组
文章数量:1605179

1 pdf转png

需要提前安装的包 pip install pymupdf
创建一个文件夹，把需要转换的pdf图片全部放入该文件夹，在文件夹中新建一个py文件，拷入代码：

import os
import fitz

pdf_dir=[]

def get_file():
    docunames = os.listdir()
    for docuname in docunames:
        if os.path.splitext(docuname)[1] == '.pdf':#目录下包含.pdf的文件
            pdf_dir.append(docuname)
            
def conver_img():
    for pdf in pdf_dir:
        doc = fitz.open(pdf)
        pdf_name = os.path.splitext(pdf)[0]
        for pg in range(doc.pageCount):
            page = doc[pg]
            rotate = int(0)
            # 每个尺寸的缩放系数为2，这将为我们生成分辨率提高四倍的图像。
            zoom_x = 2.0
            zoom_y = 2.0
            trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
            pm = page.getPixmap(matrix=trans, alpha=False)
            pm.writePNG('%s.png' % pdf_name)
            
if __name__ == '__main__':
    get_file()
    conver_img()

参考：
https://wwwblogs/ken-yu/p/12401923.html

2 pdf转word

可将PDF转换成docx文件的Python库。该项目通过PyMuPDF库提取PDF文件中的数据，然后采用python-docx库解析内容的布局、段落、图片、表格等，最后自动生成docx文件。

pdf2docx功能

解析和创建页面布局
页边距 - 章节和分栏 (目前最多支持两栏布局) - 页眉和页脚 [TODO]- 解析和创建段落 - OCR 文本 [TODO] - 水平（从左到右）或竖直（自底向上）方向文本 - 字体样式例如字体、字号、粗/斜体、颜色 - 文本样式例如高亮、下划线和删除线 - 列表样式 [TODO] - 外部超链接 - 段落水平对齐方式 (左/右/居中/分散对齐)及前后间距- 解析和创建图片 - 内联图片 - 灰度/RGB/CMYK等颜色空间图片 - 带有透明通道图片 - 浮动图片（衬于文字下方）- 解析和创建表格 - 边框样式例如宽度和颜色 - 单元格背景色 - 合并单元格 - 单元格垂直文本 - 隐藏部分边框线的表格 - 嵌套表格- 支持多进程转换
pdf2docx同时解析出了表格内容和样式，因此也可以作为一个表格内容提取工具。

限制

目前暂不支持扫描PDF文字识别
仅支持从左向右书写的语言（因此不支持阿拉伯语）- 不支持旋转的文字- 基于规则的解析无法保证100%还原PDF样式

安装
pip install pdf2docx

案例

from pdf2docx import parse

pdf_file = './第五章_副本.pdf' # pdf所在目录
docx_file = './第五章_副本.docx' # 生成的 word 文件放在哪儿
docxparse(pdf_file, docx_file)

运行结果，看，是不是还算不错：

本文标签： PDF Python word PNG

版权声明：本文标题：【python】pdf转png；pdf转word 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728479317a1159950.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Aspose工具实现word和ppt转pdf功能及遇到的一些问题

1小时前

Aspose工具包从word和ppt转到pdf的实现过程直接放项目地址说一下实现过程中遇到的坑直接放项目地址 https:githublichangliu1098File2Pdf 说一下实现过程中遇到的坑 jar包的引入&a

SpringBoot word文件转pdf

1小时前

1 首先是引入 jar 包 jar 包资源在这里大家可以下载使用链接描述-这个是需要积分的大家可以回复小编发给大家 maven 中引用外包的jar包，在你的 pom 文件中加载 jar 内容 <depen

7款可以实现 PDF 转换 Word 格式的免费在线工具

1小时前

7款免费实用的PDF转换成Word文档在线工具网站，值得你收藏！PDF to Word (docdocx) [ 多媒体类 , 推荐网站 ] 141,388 184 39 我们刚刚给大

Vue3 实现导出 Word、Excel、PDF

1小时前

Vue3 实现导出 Word、Excel、PDF 前言一、导出 Excel1、按装依赖2、方法3、在本文中的使用示例二、导出 Word1、按装依赖2、方法3、在本文中的使用示例三、导出 PDF1、安装依赖2、方法3、在本文中的使用示例

js实现在线word文档转pdf工具

1小时前

作为一名开发者，我对于创造有用的工具和解决实际问题充满热情。最近，我开发了一个在线Word文档转PDF的工具，这给我带来了巨大的喜悦和成就感。在这篇文章中&#xff0

直接从pdf复制英文到word，英文字体格式调整方法

1小时前

文章目录前言一、字体间距问题二、英文数字或字母间距过大三、换行符过多四、图片显示不全前言在撰写学术论文时，本人经常从PDF格式的参考文献中复制文本并粘贴到Word文档。但文字在复制粘贴的过程中经常发生各种各样、

Linux(CentOS)下使用unoconv转换word到pdf

1小时前

首先安装libreoffice yum install -y libreoffice.x86_64 下载或者克隆unoconv wget https:githubunoconvunoconvarchivemaster.zip

4、【办公自动化】Python实现Word转PDF

1小时前

在日常办公过程中，总是离不开和文档打交道，有一个最常用的场景就是把 Word 文档转成 PDF 格式。PDF 文档的优势在于：在不同编辑器或不同设备上，

java工具word转pdf

1小时前

需求：将文件转为pdf 方案1：使用poi工具参考：使用poi实现Word转pdf - 极墨笔记方案2：使用apose工具参考&#xff1

JAVA 使用aspose把word转pdf

1小时前

文章目录一、下载并引入jar(一般的库里面没有)二、使用步骤1.在resources下新增文件夹lib,将上面下载的两个jar存入2.POM引入3.添加授权文件，在resources下新建文件license.xml4

通过java实现word转PDF

1小时前

介绍用于java项目中解决word转pdf的需求，转换的效果跟调用的工具类、字体库、源文件（是wps还是microsoft保存的，格式版本等）、系统

Spring Boot写一个简单的PDF到Word的转换程序

1小时前

使用Spring Boot创建PDF到Word的转换程序需要几个步骤。可以使用现有的库来处理转换过程。使用ApachePDFBox进行PDF操作和使用ApachePOI创建Word文档的过程。添加依赖项: 将以下依赖项添加到“pom.xm

PDF文档免费转成Word文档，不限页数。

1小时前

链接1：https:download.csdndownloadAuspicious_air18661582 链接2：https:download.csdndownloadAus

python实现批量word转pdf

1小时前

之前用win32com模块转pdf，安装模块的过程中不太顺利，后面发现有docx2pdf模块，直接可以安装使用。 #在运行的过程中不能打开word文档&#xff0c

java html转word、pdf(包含图片)

1小时前

html转word maven依赖 <dependency><groupId>org.apache.poi<groupId><artifactId>poi<artifactId>

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览

1小时前

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览一、OpenOffice1.1 下载地址1.2 JodConverter1.3 新建实体类PDFDemo 二、实践代码二三、lin

SpringBoot使用LibreOffice word转换PDF

1小时前

由于java转pdf Aspose需要收费，documents4j是使用本地的MS Office应用做的文件格式转换，Linux没有对应的MS Office应用。这样造成了我们需要选用别的方式进行

markdown转word （vscode插件+wps法）

1小时前

1.用vscode下载一个markdown转换的插件，我用的：Markdown PDF 2.vscode打开markdown文件，然后在文件页面右键，将

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

1小时前

一、问题产生的背景当Word文档中含有中文字符时，不管是使用Spire.Pdf或Aspose-Words实现Word转换Pdf，代码的执行都需要调用操作系统的本地字体库支持&#xff0

java使用poi-tl导出word及转换PDF后的合并导出pdf

1小时前

1、背景为某单位开发的一款项目申报审批系统，用户需求在申报阶段填写的信息资料能够导出PDF。且项目申报的报告正文为用户上传，所以需要合并导出。 2、问题在项目初期阶段使用的是PDF的预设

电子爱好者 - 最新技术资讯及电子产品介绍！

【python】pdf转png；pdf转word

1 pdf转png

2 pdf转word

更多相关文章

Aspose工具实现word和ppt转pdf功能及遇到的一些问题

SpringBoot word文件转pdf

7款可以实现 PDF 转换 Word 格式的免费在线工具

Vue3 实现导出 Word、Excel、PDF

js实现在线word文档转pdf工具

直接从pdf复制英文到word，英文字体格式调整方法

Linux(CentOS)下使用unoconv转换word到pdf

4、【办公自动化】Python实现Word转PDF

java工具word转pdf

JAVA 使用aspose把word转pdf

通过java实现word转PDF

Spring Boot写一个简单的PDF到Word的转换程序

PDF文档免费转成Word文档，不限页数。

python实现批量word转pdf

java html转word、pdf(包含图片)

Java通过openOffice实现word,excel，ppt转成pdf实现在线预览

SpringBoot使用LibreOffice word转换PDF

markdown转word （vscode插件+wps法）

Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

java使用poi-tl导出word及转换PDF后的合并导出pdf

发表评论

推荐文章

惠普笔记本和台式机专业GhostXP_SP3装机系统稳定版 V2011.07

Windows 窗口置顶工具推荐 如何始终置顶窗口 窗口前置 窗口固定 窗口钉在桌面 始终保持在其他窗口前端 在其他窗口之上 PowerToys MouseInc

摈弃 Windows 低效率的工作方式，发掘 Linux 身上的 UNIX 气质

5、【办公自动化】Python实现PDF转Word

java使用poi-tl导出word及转换PDF后的合并导出pdf

热门文章

APP邀请：如何实现自动绑定用户邀请关系？

家里没网络怎么自学html,家里没宽带怎么装wifi？

CraftManager for Mac(PSsketch自动填充神器)特别版

如何利用Windows服务器发布网站？

windows环境下配置MQTT服务器（mosquitto）

win11重新安装网络驱动 win11系统重装网络驱动

网络能搜索计算机但不能连接不上,笔记本能搜到无线网络但连接不上怎么办

笔记本电脑无法连接公司网络时你应该这样做

物联网导论整理

AutoCAD二次开发2-.NET API参考文档

最新文章

玩转前端 Video 播放器

linux系统全球排名,世界排名第一的Linux系统—MX Linux 19.2 KDE 版正式发布

Android MediaPlayer播放器暂停3秒后恢复播放时视频会倒退几秒才开始播放问题源码分析和解决方案

【Android工具】更新几个平台视频流媒体播放器测试情况

自定义组件开发 第二节 MXML组件开发

android的歌词播放,android手机音乐播放器实现歌词同步

【正点原子I.MX6U-MINI应用篇】9、嵌入式Linux中的多线程编程pthread

springboot毕设项目音乐播放系统mx104（java+VUE+Mybatis+Maven+Mysql）

android编程歌词显示,Android 音乐播放器实现歌词显示

mxreality.js 免费开源的全景图全景视频VR 直播播放器介绍

android4.4 hls,在Android上播放hlsrtmp

Flex2款简单FLV播放器--很经典

2021年真正强大、最值得推荐的的视频播放器（全平台）

Android 魅族MX5——视频播放，横竖屏切换黑屏，有声音没图像

下载flashmx英文版

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Windows 窗口置顶工具推荐如何始终置顶窗口窗口前置窗口固定窗口钉在桌面始终保持在其他窗口前端在其他窗口之上 PowerToys MouseInc

自定义组件开发第二节 MXML组件开发

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载