论文部分内容阅读
一个web信息集成系统一般包含以下几个部分:领域模型构建,数据抽取,模式匹配和实体统一等.目前对与模式匹配和实体统一的研究都是各自独立的,但这两部分是相互关联的.笔者提出了一种通过模式匹配促进实体统一的新思路,并提出了基于这种思路的SMPER算法,该算法充分利用模式匹配和实体统一的关联性,使得查准率和查全率得到有效提高,从而验证了通过模式匹配促进实体统一这一新思路的正确性和可行性.