论文部分内容阅读
针对XML文档查询效率低和准确度不理想的问题,提出一种基于路径权重的树相似度算法。该算法以树节点信息相似度和树结构相似度为出发点,依据信息组织主次分明的客观规律,信息按照重要程度依次排列在树的各个层次,树节点信息自上至下重要程度逐渐减弱。根据距离根节点越近的节点表示的信息越重要,最低层信息的重要性最小的特点,依照树节点在XML文档树中的层次自动计算该节点的路径权重,克服了传统XML文档树相似度计算中树节点信息权重平均分配或手工设置的缺点,解决了XML文档树的相似度自动计算问题,实现了XML查询树与文档树的