论文部分内容阅读
碎片文件的自动拼接一直被认为是模式识别领域中一个难以解决的典型问题。它在司法物件还原、历史文献修复以及军事情报等领域都有着重要的作用。随着计算机技术的发展,人们希望通过计算机利用碎纸片的某些信息实现对碎纸片的自动拼接复原。为实现这种想法,本文提出了一种新的基于文字特征的碎纸片还原方法。本文采用平方和模型检验,灰度矩阵,数据样本统计分析,非线性最小二乘法等数学方法进行分析得到预期结果,提出了一套较完整的图像拼接算法,在特征匹配、变换参数计算和图像融合过程中均做出改善,提高了图像拼接的速度、稳定性、清晰度和自动化程度。通过MATLAB软件检测结果,实验结果表明该算法极大优于人工拼接,准确度高,并且可以适用大部分破碎文件的复原。纵向切割同一页印刷文字文件的破碎纸片仅在纸片左右存在联系,我们将其转化为灰度共生矩阵问题,据此建立平方和检测模型,构造一个E变量,通过假设检验来确定两张碎片是否左右相连(相连的可能性大小),由于碎片的选取是随机的,所以可以用相对应像素i的强度值之差的平方和统计数值来表示任意两张碎片是否能相连。即平方和越趋近于0,这两张碎片越可能相拼接,以此类推,最后得出答案。当然,由于偶然性,和计算失误,可能存在误差,或无法判断是否能拼接的情形,此时需要对其进行人工干预。