DJVU格式与PDF格式的比较

时间:2022-10-19 01:37:48

摘要:目前流行的数字文档格式很多,各有优缺点,文章主要对DJVU格式与PDF格式技术原理及各自优势进行了简单介绍,对两种格式的优缺点进行了剖析,针对不同情况下使用何种格式给出了建设性意见。

关键词:DJVU;PDF;数字化;文档格式;比较

中图分类号:TP317.4文献标识码:A文章编号:1009-3044(2011)16-3858-02

Comparing of DJVU and PDF

LIANG Min, WANG Bei

(People's University of China, Beijing 100872, China)

Abstracts: Nowdays there are a lot of document styles, all of them has its respective strongpoint. This article firstly introces DJVU and PDF to us, and then compare the two document styles, finally the author give a advice in what situation to use which document style.

Key words: DJVU;PDF;digitilize; document style; compare

目前,很多有价值的历史文件或是重要的记录报告是以纸质的形式存放,必须投入大量资金与人力来加以保存。要将这些资料数字化存储,存在诸多问题。造成许多纸质资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度,则数字档案将会变得极大;如果降低分辨率以达到较小的档案及较快的下载速度,就必须丧失图像的品质及清晰度为代价。

一般常见的JPEG、PDF、TIFF压缩技术都无法同时达成高分辨率及较小的图像档案。但DJVU压缩技术则可以完全解决这些问题。下面主要对DJVU格式与PDF格式进行介绍,并给出两种格式的比较。

1 DJVU简述

DJVU是由美国AT&T实验室于1996年开发成功的一项新的图片压缩技术,其主要技术是将图像分为背景层(纸的纹理和图片)和前景层(文本和线条)。通过将文字和背景分离开来,DJVU可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。

传统的图像压缩格式对于强对比色彩区域之间的色彩反差的可辨性差,对例如文字的还原难以令人满意。一般来说,要确保文字和线条的清晰度,需要较高的分辨率(通常为300dpi),而反映连续色彩图像和纸张的背景机理不需要很高的分辨率(通常为100dpi)。要提高清晰度,最好的方法就是将这些元素分为不同的层来进行处理。DJVU通过将文字和背景分离开来,可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性,同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。

使用DJVU格式,用户首先会很快得到页面的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质量不断提高。DJVU能达到很高的的图像品质,是因为它的技术能够将扫描文件的图像分离。它能分辨出文字及图片的部分,并且分别储存在不同层,再分别对每一层图像以最佳化的方式进行压缩,因此能产生最好的图像品质及最小的档案。这种技术将能得到清晰的文件图像而又能保持原始文件的图像品质。

通过DJVU压缩格式,以300dpi分辨率扫描的彩色页面可以从25MB缩小到30KB至80KB,而且图像质量十分优秀。对于同时包括文字和图像的彩色文件来说,DJVU文件在同等质量下通常比PEG文件小5~10倍。对于黑白页面来说,DJVU文件通常比JPEG文件小10~20倍,比GIF文件小5倍。对于那些由扫描文件制作而成的黑白PDF图像来说,DJVU文件也要比它们小3~8倍。

使用DJVU将没有任何延迟的等待时间。若比较PDF格式及DJVU格式的下载时间,对同一份50页的彩色文件而言,当DJVU下载完成后,PDF格式仅下载了一页文件。DJVU下载后的图像直接储存在计算机的内存中,并且可以在浏览器上快速地对文件进行实时的移动、缩放。换言之,DJVU能使人们只花很少的时间来扫描、储存及下载大量文件。扫描的文件可上网快速下载。DJVU可以轻易地将大量的文件以清晰、且令人难以置信的档案大小放置在网络上,供任何人观赏。压缩后的图像档案比起PDF要小得多。图像品质极高且文字清晰,可对观赏中的文件图像进行缩放、平移、分离及打印。含有缩略图功能,能先预览所有的图像画面。可以将任何的文件放置在网页上浏览。

DJVU拥有图像超级链接的功能,只要利用鼠标点选就可以轻易地建立超级链接,将所选定的区块连接至其它网站,或开启另一份新的文件。使用者的界面也极简便易学,可以直接将扫描文件转成DJVU格式,也可以建立各种样式的超级链接。另外,DJVU提供免费下载的插件,让任何人都可以在浏览器之下观赏DJVU的文件。由于DJVU压缩后的档案相当小,甚至可以将文件以E-mail附件的形式进行传送。

2 PDF简述

PDF全称Portable Document Format,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目前已成为数字化信息事实上的一个工业标准。

Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和,尤其是提供对网络信息的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。

PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。

对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。

3 DJVU与PDF比较

从技术上讲,DJVU在将纸质文档转换成电子文档方面,由于其文件小、质量高、成本低的特点,优于PDF。实际上,一些用PDF不可行的项目已经由DJVU圆满完成。

下面分析一个项目,什么情况下使用PDF比较好,什么情况下使用DJVU比较好。

当项目有以下特点时,建议使用PDF:

1) 文件内容不受人关注。PDF插件程序非常普遍,几乎每个人都有。如果用户为了您的材料需要取得DJVU浏览插件,且您的材料对他们来讲并不重要,也许用户会放弃此文件。

2) 文件大小无关紧要。如果项目比较小,并且用PDF加工的文件正好适合您需要的CD目标容量,或者您的网络比较通畅,并且您的文件比较小,那么就选择PDF。

3) 文档是黑白线性图。如果项目不是很大并且文件大小不是至关紧要的,这种项目PDF比较适合。

4) 有较高的预算。将扫描文件制作成较小、高品质的PDF文件是可能的,但是工作量非常大,因而花费较高。尽管如此,有些项目还是值得的。

反之,当项目有以下特点时,建议使用DJVU:

1) 文件有照片或者彩色或者其他复杂图形。文件大小非常重要。比如:一套CD或者拨号上网的用户要从忙碌的网络上下载您的文件。

2) 项目很大但预算很少。通过扫描得到小PDF文件的成本非常高,尤其当它们不仅仅是黑白文件的时候。

3) 文件内容受人关注。如果您放置了一些对访问者来讲比较重要的信息在网上,那么用户将会愿意取得DJVU插件这个小麻烦的。

DJVU格式的文件是目前世界上图片格式压缩体积最小、图像质量损失最少的解码格式,特别是对于在我国刚刚兴起的电子图书业来说,这种格式的图书文件制作及其推广将极具吸引力。DJVU同PDF格式的跨平台性和流行性上来比,要解决的推广和被广大用户的认可,还有很长的一段路要走。

参考文献:

[1] 黄晨.基于DJVU格式的数字图书馆[J].图书情报技术,2004(5).

[2] 王良莹.数字化信息的理想传媒形式――PDF便携文档解析[J].电脑知识与技术,2008(4).

[3] 刘聪明,郑晓惠.DJVU在资源建设中的应用及其探讨[J].现代情报,2008(7).

上一篇:基于分簇无线传感器网络密钥预分配管理方案研... 下一篇:基于J2EE框架的通用性企业网站建设