admin管理员组

文章数量:1533913

2024年2月14日发(作者:)

扫描版pdf转换成文字

第一种办法:识别工具

如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。

如果是影印版,也就是pdf 全都是扫描上去的图片格式,那你去下个汉王OCR。如果是文字版的话,就去下个 adobe acrobat 9 ,在文件的菜单下可以导出了。

尚书7号 :支持二楼的说法,PDF转WORD有这类软件,但对于你这种图片格式的根本没有用。

只能用文字识别这类软件如“尚书七号”但是还是要有一定的分辩率才能识别将其转成文档格式

赛酷OCR就可以完成你的要求,打开PDF识别,然后就可以导入WORD

如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。

它能够将扫描的文字直接导入到WORD中进行编辑。

第二种方法:office

上面几位朋友说的软件对于扫描的pdf格式文件即使能转换成word文档,也还是以图片格式显示,不能修改编辑。要真正转为Word而且能编辑修改的话,可用OCR文字识别软件。但我强烈推荐你用Office 2003中的Microsoft Office

Document Imaging组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:

用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“Microsoft

Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。

然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操 1

作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

以上仅在word2003中可用,其他版本没有Microsoft Office Document

Image Writer。

2

本文标签: 识别文字软件文件扫描