论文部分内容阅读
通过对中文规则碎片的文字分布特征进行分析,提取碎片边界信息,定义了基于欧氏距离的相邻碎片匹配度,考虑在所有碎片总体匹配度最大目标下,建立基于0-1规划的碎片拼接模型,并运用贪婪算法对某碎片文件进行模拟仿真。研究结果表明,基于0-1规划的中文规则碎片拼接模型,可准确地对碎片拼接问题进行数学描述,利用贪婪算法结合适当的人工干预可以较好地解决中文规则碎片拼接复原问题。