admin管理员组

文章数量:1532464

2023年12月25日发(作者:)

应该说,PDF文档的规范性使得浏览者在阅读上方便了许多,但倘若要从里面提取些资料,实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译,痛苦的要命,竟然傻到用Print Screen截取画面到画图板,再回粘到word中,够白了:(最近连做几份商务标书,从Honeywell本部获取的业绩资料全部是英文版的PDF,为了不再被折磨,花费了一个晚上的时间研究PDF和Word文件的转换,找到下面2种方法,出于无产阶级所谓的同甘共苦之心,共享下:)

1、实现工具:Office 2003中自带的Microsoft Office Document Imaging

应用情景:目前国外很多软件的支持信息都使用PDF方式进行发布,如果没有Adobe

Reader,无法查看其内容,如果没有相关的编辑软件又无法编辑PDF文件。转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为DOC的工作,但很多都不支持中文,我们利用Office 2003中的Microsoft Office Document

Imaging组件来实现这一要求最为方便。

使用方法:

第一步:首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office

Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

编辑提示:如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document

Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office

2003安装光盘中的“添加/删除组件”更新安装该组件。

第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

编辑提示:目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。

2、实现工具:Solid Converter PDF

应用情景:利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换,但是对

于很多“不规则”的PDF文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。为了恢复PDF的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。

使用方法:

1、下载安装文件Solid Converter PDF,点击安装。

编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。

2、运行软件,按工具栏要求选择需要转换的PDF文档,点击右下的“转换”(Convert)按扭,选择自己需要的版式,根据提示完成转换。

编辑提示:google了很多次,只找到了这个软件的非注册版本,试用期15天,很是郁闷。如有好心人找到注册版或正式版,一定要在小窝里留下地址,感激~。

下载地址:/soft/

如果还有其他比较好的转换方法,请留言。

pdf书籍快速转换为doc格式标准文本

当我试图将pdf文件转为doc格式时,遇到了两个棘手的问题:一是似乎在pdf文件天性保守,只允许选取当前页内的文本,跨页选择无效;二是将选定内容复制粘贴到word程序中后,会出现太多多余的回车,每行都有一个,想要不想要都有,该加不该加的全加。

有没有这样一种方法,不需第三方软件支持,也不必经过复杂的步骤,简单几步,就能轻松实现完美转换?经过反复试验,我真的找到了这种方法。操作步骤如下:

1、复制pdf文本。打开要转换的pdf文件,在菜单栏依次选择“视图”→“连续”,使文件内容可以跨页选取;用鼠标选取所需内容,或按下ctrl+a组合键选中全部文本;按下ctrl+c组合键复制所选内容。

2、粘贴到word文件。打开word程序,按下ctrl+v组合键,将剪贴板中的文本粘贴到新文件中。

3、转换应保留的回车。这时文本中的回车有三种类型,第一种是每行都有的,完全多余,需要删除,其特征是前面一般没有表示语句结束的标点符号;第二种是每段末尾的,应该保留,其特征是每个回车前面一般都有句号、问号、省略号、叹号、右双引号等表示段落终结的标点符号;第三种是章节标题后的,也要保留,有的特征不明显,有的则被设为与正文不同的字体。首先要做的就是根据第二、三种的特征,将这两类回车替换成其他符号,以免执行第4步时被误删。

①按下ctrl+h组合键打开“查找和替换”对话框,在“查找内容”处输入“。^p”,在“替换为”处输入“。^l”,其中“^p”代表回车,“^l”代表人工换行符,然后单击“全部替换”按钮,即可将全部以“。”结尾的回车符换成人工换行符。再用同样的方法,替换掉分别以问号、省略号、叹号、右双引号结尾的回车。

②打开“查找和替换”对话框,在“查找内容”处输入“^p”,依次单击“高级”→“格式”→“字体”,打开字体选择对话框,选取文本标题所用的字体,单击“确定”; 在“替换为”处输入“^l”;单击“全部替换”。这样即可将所有以指定字体显示的标题后面的回车替换为人工换行符。如果标题字体与正文相同,则可根据其他独特标志以类似方法替换,此不赘述。

4、删除所有回车。打开“查找和替换”对话框,在“查找内容”处输入“^p”,“替换为”处不输入任何内容,直接单击“全部替换”,则全部回车都被替换为“空”,即全部删除。

5、还原要保留的回车。打开“查找和替换”对话框,在“查找内容”处输入“^l”,“替换为”处输入“^p”,单击“全部替换”,则全部拟保留的回车都被恢复。

如果还嫌麻烦,我们也可以使用word提供的“宏”操作功能,将一系列的操作录制成可以一次按键、自动执行的“宏”命令,以减少重复工作。操作步骤是:

①单击word菜单栏“工具”→“宏” →“录制新宏”,弹出“录制宏”的对话框;

②单击“键盘”工具图标,按下你将指定给这个宏的快捷键,依次单击“指定”和“关闭”按钮;

③执行从2至5的全部操作;

④单击页面左上方“停止”小窗口中的正方形按钮(停止录制),新宏录制完毕。

这样,下次需要在word中转换粘贴来的pdf文本时,只需要打开空白文件,按下刚才指定的快捷键,一切就全OK了。这样整个操作就简化成了两个步骤:一是复制pdf文档内容,二是在word程序中执行宏操作。

打破超星封锁——PDG转PDF新方法

用超星阅览器阅读PDG格式图书,需要一页一页地翻,很不爽,很想转为PDF格式以便于保存、阅读和打印。在网上搜索一下,基本上都是利用PDF虚拟打印机的方法。由于新版本的ssreader对虚拟打印进行了控制,直接使用adobe acrobat以及office 2003的虚拟打印机需要改名,操作繁琐,简单试了几次没有成功;又不想下载安装其他的虚拟打印机,只好暂时放弃。

偶然翻看Acrobat Distiller的帮助,发现其可以将PS格式的打印文件转为PDF文件,于是产生新的思路,经试验完全可行。现将具体方法与大家共享。

1、找到任意一款打印机的PS驱动程序,并安装。

注意:是真实打印机(非虚拟打印机)的驱动,没有打印机没关系,我们只是利用他打印到文件中,而不是纸上。另外,打印机驱动一般分两种:PCL和PS,我们需要PS驱动。PS驱动程序可到打印机生产厂商的网站上下载,比如爱吃屁(HP)。

2、打开PDG文件。

3、计算书的总页数(封面+版权+...+前言+目录+正文)。

正文的页数可以在阅览器中直接看到,其他页数的自动计算方法没来得及研究,我用笨方法:数。

4、显示封面页,选择打印,起始页为当前页,页数为刚才计算的总页数;

选择安装的PS打印机,选择打印到文件。此时会弹出对话框,输入文件名,文件的扩展名最好为.prn(其他也可以,但prn文件Acrobat Distiller可自动识别),文件名中最好带路径,以便于查找。

5、用Acrobat Distiller打开prn文件,按提示即可转为pdf文件。

我用这种方法试验,转一本近500页的书只要1,2分钟的时间(当然不包括数页数的时间),并且从封面到正文都在一个pdf文件中。

词法优点:

超星为封锁虚拟打印机下了一番功夫,我相信在ssreader的以后版本中还会封锁更多的虚拟打印机。本文的方法使用真实打印机的驱动,除非超星不允许pdg文件打印到纸上,否则他永远也阻止不了我们将pdg转为pdf

本文标签: 文件打印机转换