论文部分内容阅读
在Web上精确检索XML代价非常昂贵。为了缩短操作代价,定义了XML查询松弛的概念,利用三个松弛原操作对用户提交的查询进行松弛,产生查询松弛集。为了定量衡量松弛的可信度,定义了松弛损率,引入传统信息检索中TFIDF评分思想,给出了基于文档统计特性和松弛损失的XML Web检索的TFIDF评分公式,并实现该算法。一系列实验表明此方法在XML Web数据检索中具有常数查全率和较高的查准率。