admin管理员组

文章数量:1531451

2024年7月24日发(作者:)

巧用OCR,为你编辑文档省钱又省力

相信从事文字工作的同事都遇到或可能遇到这样的问题:有

时想将报刊、纸质文件这些文本资料上的文字变成自己的“东西”,

但苦于文字资料太长,工作时间又紧,加上自己的打字速度太慢

而不又想花钱找专业打字员,有没有更好的办法来解决?有!那就

是用好你办公桌上的扫描仪,下载一个OCR字符识别软件,几分

钟就能搞定,为你编辑文档省钱又省力。

“OCR”是英文“Optical Character Recognition”(光学字

符识别)的缩写。该技术是指用电子设备(例如扫描仪或数码相

机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,

然后用字符识别方法将形状翻译成计算机文字的过程;即,对文

本资料进行扫描,然后对图像文件进行分析处理,获取文字及版

面信息的过程。这也就是笔者运用扫描仪与OCR技术的结合,实

现编辑文档的理论依据。

这里暂以“汉王OCR6.0”版本(当前最新版为汉王 PDF OCR

8.1 简体中文版,免费)为例,利用主管单位配发、各辖属机构

普遍使用的柯达(Kodak i1200)扫描仪予以示范,希望对感兴趣

的朋友有所帮助。

第一步:打开“汉王OCR6.0”应用程序,单击“文件”,“选

择扫描仪”,在“选择来源”对话框选择“WIA-KODAK i1200 Scanner

- 1 -

1.0”扫描仪;

第二步:单击“文件”,选择“扫描”,在“用KODAK i1200

Scanner扫描”对话框,选择“黑白照片或文本”选项,根据需

要设置“纸张大小”,而后点击“扫描”,完成资料的扫描。

扫描后的文件为图片格式,文件名为*.tif,默认保存路径为

c:hwocr60image,你也可先创建文件夹,按“扫描到”按钮,

更改保存路径,将自己命名的扫描件保存到这个文件夹,需要转

发或使用时直接调用。

第三步:单击“识别”,选择“开始识别”,在编辑框内编辑

因识别错误或需要更改的文字,然后点击“输出”、“到指定文件

格式”,在“保存识别文件”对话框选择保存路径和保存类型。

编辑过的识别件为记事本文件格式,文件名为*.txt,默认保

存路径也为c:hwocr60image,你同样可以创建属于自己的文件

夹。识别后的文件保存后,打开这个记事本文件,复制并粘贴到

自己需要编辑的文档就可以了。

对于曾经扫描并保存过的文件,也可以进行识别。具体方法

请参照第二个步骤,单击“文件”后,选择的不是“扫描”而是

“打开图像”,其余步骤完全一样。(abchinaqx)

- 2 -

本文标签: 文件保存文字选择