论文部分内容阅读
【摘 要】TXT数字水印技术是通过隐藏的数字水印信息,保证TXT文本文档身份识别和来源追踪,增强事前威慑和事后追踪能力,保障客户敏感数据安全。TXT数字水印技术从接入管理、水印管理、水印生成算法和水印安全控制四个方面着手建立了一种全新的针对TXT文本文档的数据追踪模式,提升系统的TXT文本文档安全保障能力。
【关键词】TXT数字水印 数字水印 文本文档数字水印 水印生成算法 水印安全控制
在目前互联网、云计算、大数据等技术高速发展的时期,企业数据仓库中所存储的业务数据类型及数据量不断增加,涉及到的敏感数据也越来越多,同时由于TXT文本文档的广泛应用, TXT中存有较多的敏感数据,一旦泄漏,将给企业和社会带来极大的安全影响和经济损失,因此如何能有效保护系统TXT数据的安全,成为急待解决的安全问题。传统的安全控制主要采用“事前”权限控制、“事中”数据加密以及“事后”数据追踪,其中数据追踪需要采用全文检索技术来实现,硬件部署成本很大,因此TXT数字水印技术的引入和研究,只需存储用户访问的水印要素信息,可以节约大量的成本并保证TXT身份识别和来源追踪,对文档传播者起到一定的威慑作用,具有较高的现实意义。
一、接入管理
接入管理用于管理数字水印装置的接入,并提供多样化的接入方式,增强数字水印的易用性,提升数字水印的客户端适应能力,主要包括HTTP接入、标准WebService SOAP服务接入,和API调用方式的接入。应用系统通过接入管理的接口,将要进行水印嵌入的TXT文本文档,以及用于形成水印的相关要素信息传递给水印管理模块。
二、水印管理
水印管理模块将应用系统传递过来的水印相关要素信息进行持久化存储,并生成与之相对应的水印唯一识别码,其中用于形成水印的相关要素信息包括用户编号、用户名、组织机构、ip地址、访问时间等信息。具体如下图所示:
三、TXT水印生成算法
TXT水印生成算法主要通过隐藏类型的字符编码,如Tab键字符、空格键字符等,经过一定的组合算法合成,并通过TXT不可见水印处理算法将隐藏编码随机散布于一个或多个记录行的尾部,最终构成TXT文本文档的隐藏记录。
具体算法说明如下:
(一)TXT文档处理引擎:具备TXT文档文件流的处理能力,包括文件的打开、关闭、文件游标的定位,文件数据的读取、写入和删除等功能,用于解析TXT文档、嵌入隐藏的不可见水印。
(二)TXT不可见水印处理算法:负责将隐藏的水印信息随机散布于一个或多个记录行的尾部,形成不可见的TXT数字水印。 “随机散布算法”原理举例如下:将隐藏水印信息平均拆分成<=n份(没法平均分配时,多出的归给最后一份),即当TXT文本文档的记录行数>=n时,则都拆分成n份,而TXT文本文档的记录行数如果 (三)TXT隐藏记录生成算法:主要通过隐藏类型的字符编码,如Tab键字符、空格键字符等,经过一定的组合算法合成,并通过TXT不可见水印处理算法将隐藏编码随机散布于一个或多个记录行的尾部,最终构成TXT文本文档的隐藏记录。举例如下:假设水印唯一识别码是“1001”,将水印唯一识别码拆分成单个数字,每个数字由空格键字符的组合来替代,而数字跟数字之间用Tab键字符隔开,则其对应的隐藏记录为“2个空格键+tab键+1个空格键+tab键+一个空格键+tab键+2个空格键”,即“ ”,在TXT文本文档中对应的16进制码为
四、水印安全控制
用于控制水印的安全校验,包含水印信息的加密和解密提取,以及有效性和完整性的检测。加密后的“水印信息安全串”主要由:水印前缀+水印识别码加密串+水印后缀+水印校验码,几个部分组成。具体说明如下:
(一)水印前缀和水印后缀:都由“空格键+tab键+tab键+空格键”组成;
(二)水印识别码加密串:由原始水印识别码进行可逆加密后得到,如:由原始水印识别码*2+1组成,即假设水印识别码为91,则加密串为“183”;
(三)水印校验码:由水印识别码长度和原始水印识别码的可逆加密串组成,如:由两位的水印识别码长度(不足两位补零)+(原始水印识别码*3+2)组成,即假设水印识别码为91,则水印校验码为02275。
提取水印信息后,需进行安全检测,即将校验码和水印识别码加密串分别解码后进行数据和长度的比对,结果一致才能确认水印没有被破坏。水印提取和检查通过专门的水印检查器实现。
TXT数字水印使用随机散布算法、隐藏记录生成算法等,成功解决了隐藏数字水印生成算法问题,有效提升了TXT数字水印的防破坏能力;同时可精确、快速的定位安全事故責任人,有效节约了数据追踪成本,提升数据追踪效率,增强客户信息安全管控能力。
【关键词】TXT数字水印 数字水印 文本文档数字水印 水印生成算法 水印安全控制
在目前互联网、云计算、大数据等技术高速发展的时期,企业数据仓库中所存储的业务数据类型及数据量不断增加,涉及到的敏感数据也越来越多,同时由于TXT文本文档的广泛应用, TXT中存有较多的敏感数据,一旦泄漏,将给企业和社会带来极大的安全影响和经济损失,因此如何能有效保护系统TXT数据的安全,成为急待解决的安全问题。传统的安全控制主要采用“事前”权限控制、“事中”数据加密以及“事后”数据追踪,其中数据追踪需要采用全文检索技术来实现,硬件部署成本很大,因此TXT数字水印技术的引入和研究,只需存储用户访问的水印要素信息,可以节约大量的成本并保证TXT身份识别和来源追踪,对文档传播者起到一定的威慑作用,具有较高的现实意义。
一、接入管理
接入管理用于管理数字水印装置的接入,并提供多样化的接入方式,增强数字水印的易用性,提升数字水印的客户端适应能力,主要包括HTTP接入、标准WebService SOAP服务接入,和API调用方式的接入。应用系统通过接入管理的接口,将要进行水印嵌入的TXT文本文档,以及用于形成水印的相关要素信息传递给水印管理模块。
二、水印管理
水印管理模块将应用系统传递过来的水印相关要素信息进行持久化存储,并生成与之相对应的水印唯一识别码,其中用于形成水印的相关要素信息包括用户编号、用户名、组织机构、ip地址、访问时间等信息。具体如下图所示:
三、TXT水印生成算法
TXT水印生成算法主要通过隐藏类型的字符编码,如Tab键字符、空格键字符等,经过一定的组合算法合成,并通过TXT不可见水印处理算法将隐藏编码随机散布于一个或多个记录行的尾部,最终构成TXT文本文档的隐藏记录。
具体算法说明如下:
(一)TXT文档处理引擎:具备TXT文档文件流的处理能力,包括文件的打开、关闭、文件游标的定位,文件数据的读取、写入和删除等功能,用于解析TXT文档、嵌入隐藏的不可见水印。
(二)TXT不可见水印处理算法:负责将隐藏的水印信息随机散布于一个或多个记录行的尾部,形成不可见的TXT数字水印。 “随机散布算法”原理举例如下:将隐藏水印信息平均拆分成<=n份(没法平均分配时,多出的归给最后一份),即当TXT文本文档的记录行数>=n时,则都拆分成n份,而TXT文本文档的记录行数如果
四、水印安全控制
用于控制水印的安全校验,包含水印信息的加密和解密提取,以及有效性和完整性的检测。加密后的“水印信息安全串”主要由:水印前缀+水印识别码加密串+水印后缀+水印校验码,几个部分组成。具体说明如下:
(一)水印前缀和水印后缀:都由“空格键+tab键+tab键+空格键”组成;
(二)水印识别码加密串:由原始水印识别码进行可逆加密后得到,如:由原始水印识别码*2+1组成,即假设水印识别码为91,则加密串为“183”;
(三)水印校验码:由水印识别码长度和原始水印识别码的可逆加密串组成,如:由两位的水印识别码长度(不足两位补零)+(原始水印识别码*3+2)组成,即假设水印识别码为91,则水印校验码为02275。
提取水印信息后,需进行安全检测,即将校验码和水印识别码加密串分别解码后进行数据和长度的比对,结果一致才能确认水印没有被破坏。水印提取和检查通过专门的水印检查器实现。
TXT数字水印使用随机散布算法、隐藏记录生成算法等,成功解决了隐藏数字水印生成算法问题,有效提升了TXT数字水印的防破坏能力;同时可精确、快速的定位安全事故責任人,有效节约了数据追踪成本,提升数据追踪效率,增强客户信息安全管控能力。