论文部分内容阅读
PDF格式文件目前已成为数字化信息事实上的一个工业标准,它的跨媒体、跨平台、安全性使其在网络中应用越来越广泛,对其研究显得日益重要。如何生成PDF文件在国内研究的较少,本文探讨了PDF文件的生成方法,详细介绍了PDF文件格式,PDF文件的特点及应用,通过一个PDF文件实例分析了其组成结构:通过实验说明如何利用开源软件iTextSharp生成PDF文件。在实际使用PDF文件的过程中,如何防止PDF文件被篡改也是一个非常重要的研究课题,本文我们可以在PDF文件上加一个标记,如果这个标记的值发生了变化就说明这个文档被篡改过了,而这个文件就不是最原始的文件了。本文通过利用MD5值对PDF文档进行原始性验证,MD5值最大的特点就是对一个文件所取的MD5码总是唯一的,文件如果被改动,其MD5码也会发生变化,这样我们只要核对PDF文件的MD5码就可以证明所使用的PDF文件是否是真实的、原始的。具体方法有两种,一种是对发布的PDF文件计算其MD5值,然后直接将MD5码也随同PDF文件一同发布,这样其它用户在得到PDF文件的时候可以通过计算其MD5码来确认文档的真实性。随着PDF文件发布的增多,需要建立一个网站和数据库专门发布和存放PDF文件及MD5码,这样实现起来还是很容易的。第二种是借用数字水印的思路,我们可以将这个MD5写到文件的一个隐藏区,一般二进制文件格式都有文件头和文件体部分、文件尾三个部分,而文件头、尾是用户看不到的,一般也会预留一部分字节用于以后扩展,或可以在文件头写入特殊标记的数据。通过对前面PDF文件格式的分析,将这个md5写在文件尾。然后对PDF文件流计算MD5值,然后将该文件流和MD5值一起写到硬盘上,形成一个添加了MD5值的PDF文件。文件可以正常打开和使用,而且别人也不会看到添加的这个MD5值。通过实验观察了在不同环境下操作PDF文件对其MD5码的影响。通过实验得出结论:利用开源软件iTtextSharp可以很方便生成PDF文件,也能很好地支持中文。利用MD5码可以验证一个PDF文件的原始性和真实性,而PDF文件只要不改变其本身,它的MD5码在实验中列出的操作环境下都不会改变。在此基础上提出了如何使用本文方法的策略,所以本文对我国使用PDF文件降低办公成本是有实际意义的。