Acrobat OCR识别文本功能提取图片文字|电子爱好者

admin管理员组
文章数量:1535605

2023年12月23日发(作者：)

Acrobat OCR识别文本功能提取图片文字

来源：发布时间：12-04-11 编辑：李静

Acrobat自带的OCR识别文本功能，可以将图片格式的PDF文件（扫描件或者图片制作）转换成文本文件，从而提取图片中的文字。您可使用Acrobat识别以前已转换成PDF扫描文档的文本。光学字符识别（OCR）软件允许您搜索、更正和复制扫描的PDF中的文本。要将OCR应用于PDF，必须已经将原始扫描仪分辨率设置为72dpi或更高。

首先确保电脑已安装AdobeAcrobat。

OCR识别文本功能的设置

1、识别单个文档中的文本

打开扫描的PDF。

选择“文档”>“OCR文本识别”>“使用OCR识别文本”。

在“识别文本”对话框中，选择“页面”下的一个选项。

（可选）单击“编辑”打开“识别文本-设置”对话框，然后按需要指定选项。

2、识别多个文档中的文本

在Acrobat中，选择“文档”>“OCR文本识别”>“使用OCR识别多个文件中的文本”。

在“页面捕捉多个文件”对话框中，单击“添加文件”，选择“添加文件”，“添加文件夹”或“添加打开的文件”。然后选择相应的文件或文件夹。

在“输出选项”对话框中，指定输出文件的目标文件夹、文件名首选项以及输出格式。

在“识别文本-设置”对话框中，指定选项，然后单击“确定”。

3、识别PDF包中组件PDF中的文本

在PDF包中选择一个或多个扫描的PDF。

选择“文档”>“OCR文本识别”>“使用OCR识别文本”。

在“识别文本-设置”对话框中指定选项。

OCR识别文本功能的使用

1.捕获扫描页面

通过Acrobat的“使用OCR识别文本”功能可以将扫描页面由图像转换成可搜索的PDF文档。Acrobat允许以3种格式捕获扫描页面：格式化的文本和图形PDF、可搜索的图像PDF（精确）以及可搜索的图像PDF（紧凑）。可搜索的图像PDF在PDF文档中将扫描图像放在前景中，而将捕获的文本放在不可见的背景层中。

捕获扫描页面的具体步骤如下所述：

（1）选择“文档>使用OCR识别文本>开始”命令，弹出“识别文本”对话框。

（2）选择要捕获的页面。

（3）单击“编辑”按钮，弹出“识别文本－设置”对话框，选择“OCR识别的主要语言”和“PDF输出样式”选项，然后单击“确定”按钮。

（4）单击“确定”按钮开始OCR识别文本过程。

使用OCR识别文本不仅可将扫描页面中的文字内容转换成可搜索文本，另外还可以校正由于在扫描过程中导致的页面歪斜。

2.修正转化文本

Acrobat在识别扫描页面是，可能由于字迹模糊等原因不能正确识别文本，Acrobat将对存在疑点处标记为“捕获疑点”。被标记为“捕获疑点”之处以文字捕获前的位图显示，而该文字的替换字符则在一个不可见的底层上。

选择“文档>使用OCR识别文本>查找所有的OCR可疑物”命令，所有标记为“捕获疑

点”之处以红色线框显示。选择“文档>使用OCR识别文本>查找第一个OCR可疑物”命令，弹出“查找元素”对话框。

单击“查找下一个”按钮，疑点处的位图依次显示在该对话框中，同时当前工具切换到“TouchUp文本工具”，并选中替换的文本，如果替换文本没有错误，可以单击“接受和查找”按钮，疑点处的位图将被接受的文本替换显示，如果替换文本不正确，可以使用“TouchUp文本工具”先进行修正，然后再单击“接受和查找”按钮进行确认。

本文标签：文本识别扫描对话框

版权声明：本文标题：Acrobat OCR识别文本功能提取图片文字内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1703291769a48192.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Acrobat OCR识别文本功能提取图片文字

更多相关文章

CAD软件中文本如何屏蔽

解决: 0x803f7001 在运行Microsoft Windows 非核心版本的计算机上，运行“ slui.exe 0x2a 0x803f7001 “以显示错误文本,激活win10步骤流程。

文本文档中html图片快捷键,HTML+CSS入门 常用的键盘快捷键详解

Windows系统激活问题：在运行Microsoft Windows 非核心版本的计算机上，运行 slui.exe 0x2a 0x803f7001 以显示错误文本 解决方案

大模型部署手记（8）LLaMa2+Windows+llama.cpp+英文文本补齐

科大讯飞NLP算法赛baseline：文本分类实践+0.79

【Transformers】第 5 章：微调文本分类的语言模型

html超链接qq,超链接打开qq对话框

点击网页上的联系我们弹出QQ对话框的实现

计算机将文本朗读出来应用语音,如何实现电脑语音朗读文字？可以选择两种方法...

软件测试学习之路-----文本编辑器和计算机基本命令笔记

黑马程序员_GUI(布局,Frame,事件监听机制,对话框Dialog,菜单,打开和保存文件)

（四）Excel函数应用之文本、日期和时间函数

Excel：通过Lookup函数提取指定文本关键词

Web前端 HTML常用标签 文本格式化标签 图像标签

电脑打开其他电脑的TXT文本时出现乱码的处理办法

从零开始构建基于milvus向量数据库的文本搜索引擎

使用大型语言模型进行文本摘要

Linux文本处理工具和Shell编程基础

ChatGPT 一统所有 AI 模型入口，四步实现文本分类、图像生成等 24 种复杂任务！...

发表评论

推荐文章

为什么硬盘在macbook上无法编辑？mac不能往移动硬盘拷东西

微软终止支持Win7 但系统仍然可正常使用

简单操作拥有Win7XP双系统

geocoder_Android Geocoder反向地理编码

安全应急响应中心 Security Response Center（src）简介

热门文章

蓝屏代码分析

claude 3 官网_claude 3 中文官网_克劳德 ai官网入口

爬取百度翻译（可中英互译）

日常用电脑软件合集

android 浏览器抓包工具下载,WebSee app下载-WebSee抓包工具v1.2.1 安卓版-腾牛安卓网...

【图文详解】MySQL事务日志 Redo log(重做) 和 Undo log（撤销）

一次失败的Thoughtworks面试经历

UG10.0 win10安装问题 This application has unexpectly quit.

计算机上的win键是什么意思,win是电脑上哪个键

当你的网站被百度定义为“风险“ “百度网址安全中心提醒您：该页面可能已被非法篡改！“

最新文章

CG Industry magazines and online social networks

分布式事务笔记

python如何读取mat文件可视化_python 数据分析--数据可视化工具matplotlib

python 数据可视化工具--matplotlib

1.30 尚硅谷javaweb学习

工业4.0知识图谱

关于苹果企业开发者账号的新问题：深入审查企业账号的主体信息！

IEEEACM ASONAM 2014 Industry Track Call for Papers

IEEE-trans“水刊”系列！审稿最快3周！一投就中，非OA，稳稳的黑马潜力刊！

51Job行业分类和行业编号汇总，格式：Json

人工智能对金融业的影响_人工智能如何改变金融业

保姆级别教你MySQL的下载和安装

Industry Classification Benchmark 工业行业分类

What is AEC, EPC and OO? Industry Terminology Defined!

firefly-rk3399jd4核心板+底板：编译android

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

文本文档中html图片快捷键,HTML+CSS入门常用的键盘快捷键详解

Windows系统激活问题：在运行Microsoft Windows 非核心版本的计算机上，运行 slui.exe 0x2a 0x803f7001 以显示错误文本解决方案

Web前端 HTML常用标签文本格式化标签图像标签

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载