基于特征码的大规模XML文档去重研究

来源 :中国管理信息化:综合版 | 被引量 : 0次 | 上传用户:lhyu11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文总结了目前基于XML文档的一些信息检索技术,并通过一种特征码技术,将海量的XML文档中内容重复的文档检索出来.利用可以将XML文档映射到关系数据库中的X-RESTORE技术管理、存储、查找XML文档,并利用它的解析器快速定位特征码.将特征码通过高效的B+树来索引,大大提高系统的处理效率.
其他文献
以某钨钼多金属矿工艺矿物学研究为基础,对其进行选矿工艺研究。试验综合回收黑钨矿和辉钼矿。在工艺流程试验的基础上,确定了重选-磁选-浮选联合工艺流程。原矿WO 3含量为0.
通过对近五年来(2015—2019年)中国社会科学引文索引所收录的档案学领域期刊刊载论文进行计量研究,文章在以关键词聚类方式揭示我国档案学研究热点领域后,采用灰色预测GM(1,1
长期以来,班主任给人的印象普遍是起早贪黑,疲惫不堪,终日琐事缠身。究其原因是班主任把原本属于学生能够自己完成的事都一一代劳了,剥夺了学生经历磨练的机会。著名教育家斯