admin管理员组文章数量:1533913
2024年2月14日发(作者:)
扫描版pdf转换成文字
第一种办法:识别工具
如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。
如果是影印版,也就是pdf 全都是扫描上去的图片格式,那你去下个汉王OCR。如果是文字版的话,就去下个 adobe acrobat 9 ,在文件的菜单下可以导出了。
尚书7号 :支持二楼的说法,PDF转WORD有这类软件,但对于你这种图片格式的根本没有用。
只能用文字识别这类软件如“尚书七号”但是还是要有一定的分辩率才能识别将其转成文档格式
赛酷OCR就可以完成你的要求,打开PDF识别,然后就可以导入WORD
如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。
它能够将扫描的文字直接导入到WORD中进行编辑。
第二种方法:office
上面几位朋友说的软件对于扫描的pdf格式文件即使能转换成word文档,也还是以图片格式显示,不能修改编辑。要真正转为Word而且能编辑修改的话,可用OCR文字识别软件。但我强烈推荐你用Office 2003中的Microsoft Office
Document Imaging组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:
用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“Microsoft
Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。
然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操 1
作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
以上仅在word2003中可用,其他版本没有Microsoft Office Document
Image Writer。
2
版权声明:本文标题:计算机系列 《扫描版pdf转换成文字版的方法》(文字版) 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dianzi/1707907307a210090.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论