admin管理员组

文章数量:1538621

2024年5月26日发(作者:)

ISSN 1009-3044 

E—mail:xsjl@ecec.net.cn 

http://www.dnzs.net.en 

Te1:+86—55 l一5690963 5690964 

Compu ̄r Knowledge and Technology电脑知识与技术 

Vo1.7,No.16,June 201 1,PP.3858—3859 

DJVU格式与PDF格式的比较 

粱民,王北 

(中国人民大学。北京100872) 

摘要:目前流行的数字文档格式很多,各有优缺点,文章主要对DTVu格式与PDF格式技术原理及各自优势进行了简单介绍,对两 

种格式的优缺点进行了剖析.针对不同情况下使用何种格式给出了建设性意见。 

关键词:D1VU;PDP;数字化;文档格式;比较 

中囤分类号:TP317.4 支献标识码:A 文章编号:1009—3044(2011)16—3858—02 

Comparing of DJVU and PDF 

LIANG Min.WANG Bei 

(People S University of China,Beijing 100872,Chin a] 

Abstracts:Nowdays there are a lot of document syltes,all of them has its respective strongpoint.This article firstly introces DJVU and 

PDF tO us,and then compare the two document styles,finally the author give a advice in what situation tO use which document sylte. 

Key words:DJVU;PDF;digitilize;document style;conlpare 

目前,很多有价值的历史文件或是重要的记录报告是以纸质的形式存放,必须投入大量资金与人力来加以保存。要将这些资料 

数字化存储。存在诸多问题。造成许多纸质资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度 则数字档案将 

会变得极大;如果降低分辨率以达到较小的档案及较快的下载速度,就必须丧失图像的品质及清晰度为代价。 

般常见的JPEG、PDF、TIFF 缩技术都无法同时达成高分辨率及较小的图像档案。但DJVU压缩技术则可以完全解决这些问 

题。下面主要对DJVU格式与PDF格式进行介绍,并给出两种格式的比较。 

1 DJVU简述 

DJVU是由美国AT&T实验室于1996年开发成功的一项新的图片压缩技术,其主要技术是将图像分为背景层(纸的纹理和图 

片)和前景层(文本和线条)。通过将文字和背景分离开来,DJVU可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地 

提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。 

传统的图像 缩格式对于强对比色彩区域之间的色彩反差的可辨性差,对例如文字的还原难以令人满意。一般来说。要确保文 

字和线条的清晰度,需要较高的分辨率(通常为300dpi),而反映连续色彩图像和纸张的背景机理不需要很高的分辨率(通常为 

100dpi)。要提高清晰度,最好的方法就是将这些元素分为不同的层来进行处理。DJVU通过将文字和背景分离开来,可以用高分辨率 

来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性,同时用较低的分辨牢来压缩背景图片,从而使整个图像的质量得到 

了保证。 

使用DJVu格式,用户首先会很快得到页而的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质 

量不断提高。DJVU能达到很高的的 像品质,是因为它的技术能够将扫描文件的图像分离。它能分辨出文字及图片的部分,并且分 

别储存在不同层.再分别对每一层图像以最佳化的方式进行压缩,因此能产生最好的 像品质及最小的档案。这种技术将能得到清 

晰的文件图像而又能保持原始文件的 像品质。 

通过DJVU压缩格式,以300dpi分辨率扫描的彩色页面可以从25MB缩小到30KB至80KB,而且图像质量十分优秀。对于同时 

包括文字和图像的彩色文件来说,DJVU文件在同等质量下通常比PEG文件小5—10倍。对于黑白页面来说,DJVU文件通常比 

JPEG文件小10—20倍,比GIF文件小5倍。对于那些由扫描文件制作而成的黑白PDF图像来说,DJVU文件也要比它们小3 ̄8倍。 

使用DJVU将没有任何延迟的等待时间。若比较PDF格式及DJVU格式的下载时间,对同一份5O页的彩色文件而言,当DJVU 

下载完成后,PDF格式仅下载了一页文件。DJVU下载后的图像直接储存在计算机的内存中,并且可以在浏览器上快速地对文件进 

行实时的移动、缩放。换言之,DJVU能使人们只花很少的时间来扫描、储存及下载大量文件。扫描的文件可上网快速下载。DJVU可 

以轻易地将大量的文件以清晰、且令人难以置信的档案大小放置在网络上,供任何人观赏。压缩后的图像档案比起PDF要小得多。 

图像品质极高且文字清晰,可对观赏中的文件图像进行缩放、平移、分离及打印。含有缩略图功能.能先预览所有的图像画面。可以 

将任何的文件放置在网页上浏览。 

DJVU拥有图像超级链接的功能,只要利用鼠标点选就可以轻易地建立超级链接,将所选定的区块连接至其它网站,或开启另 

份新的文件。使用者的界面也极简便易学,可以直接将扫描文件转成DJVU格式,也可以建立各种样式的超级链接。另外,DJVU 

提供免费下载的插件,让任何人都可以在浏览器之下观赏DJVU的文件。由于DJVU压缩后的档案相当小.甚至可以将文件以E一 

收稿日期:2011—05—06 

作者简介:梁民,男,北京人,工程师,硕士,主要研究方向为计算机网络应用,数字化图书馆建设;王北,男,北京人,工程师,本科,主 

要研究方向为计算机网络应用,多媒体教学。 

3858 软件姬计开发 本栏目责任编辑:谢媛媛 

第7卷第16期(2011年6月) Computer Knowledge and Technology电脑知识与技术 

mail附件的形式进行传送。 

2 PDF简述 

PDF全称Portable Document Fo ̄at,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在 

Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Intemet上进行电子文档发行和数字化信 

息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目 

前已成为数字化信息事实上的一个工业标准 

Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的 

支持。为了达到此目的,PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设 

备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件.集 

成度和安全可靠性都较高。 

PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或 

多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文 

件中一些重要结构的定位信息。正是由于PDF文件的种种优点,它逐渐成为出版业中的新宠。 

对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调 

节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使 

读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在13常生活中的普及。Adobe公司以PDF文件技术为核心,提供了 

整套电子和网络出版解决方案。其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator 

等。Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。 

3 DJVU与PDF比较 

从技术上讲,DJVU在将纸质文档转换成电子文档方面,由于其文件小、质量高、成本低的特点,优于PDF。实际上,一些用PDF 

不可行的项目已经由DJVU圆满完成。 

下面分析一个项目,什么情况下使用PDF比较好,什么情况下使用DJVU比较好。 

当项目有以下特点时,建议使用PDF: 

1)文件内容不受人关注。PDF插件程序非常普遍,几乎每个人都有。如果用户为了您的材料需要取得DJVU浏览插件,且您的 

材料对他们来讲并不重要,也许用户会放弃此文件。 

2)文件大小无关紧要。如果项目比较小,并且用PDF加工的文件正好适合您需要的CD目标容量,或者您的网络比较通畅,并 

且您的文件比较小,那么就选择PDF。 

31文档是黑白线性图。如果项目不是很大并且文件大小不是至关紧要的,这种项目PDF比较适合。 

4)有较高的预算。将扫描文件制作成较小、高品质的PDF文件是可能的,但是工作量非常大,因而花费较高。尽管如此,有些项 

目还是值得的。 

反之,当项目有以下特点时,建议使用DJVU: 

11文件有照片或者彩色或者其他复杂图形。文件大小非常重要。比如:一套CD或者拨号上网的用户要从忙碌的网络上下载您 

的文件。 

2)项目很大但预算很少。通过扫描得到小PDF文件的成本非常高,尤其当它们不仅仅是黑白文件的时候。 

31文件内容受人关注。如果您放置了一些对访问者来讲比较重要的信息在网上,那么用户将会愿意取得DJVU插件这个小麻 

烦的。 

DJVU格式的文件是目前世界上图片格式压缩体积最小、图像质量损失最少的解码格式,特别是对于在我国刚刚兴起的电子图 

书业来说,这种格式的图书文件制作及其推广将极具吸引力。DJVU同PDF格式的跨平台性和流行性上来比,要解决的推广和被广 

大用户的认可.还有很长的一段路要走。 

参考文献: 

【1]黄晨.基于DJVU格式的数字图书馆[J].图书情报技术,2oo4(s). 

f21王良莹.数字化信息的理想传媒形式——PDF便携文档解析『J】.电脑知识与技术,2008(4). 

f3]刘聪明,郑晓惠.DJVU在资源建设中的应用及其探讨『J1.现代情报,2008(7). 

本栏目责任编辑:谢媛媛 软件设计开发 3859 

本文标签: 文件图像格式文字文档