【摘 要】
:
为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打
论文部分内容阅读
为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打下基础.引入自然语言领域中成熟的N-Gram思想,将基于N-Gram的划分方式应用在路径约束相似度计算中,加快了计算效率和精确度.运用正整数和各种权值简化N-Gram信息的提取和运算.实验结果表明,方法提高了聚类的准确率和召回率.
其他文献
探讨广义算子模型在供应链系统研究中的应用.分析典型的供应链大系统信息传递流程,按照分解综合的方法,先建立外部模型(粗粒度广义算子模型),再逐层深入分解,针对每个决策点
对两阶段资金投入条件下多项目组合中基于项目启动水平的资金分配问题进行了研究.由于已启动项目的资金不能按预算全额投入,因此文中引入了项目启动水平的概念,低于最低启动
双界顶隧道为贵广铁路贺州至广州段的控制性工程,本文根据该隧道的水文地质勘察资料.分析评价了其地质构造、地表水的发育,地表水及地下水的补给等水文地质特征,采用解析法对
传统的数据发布隐私保护研究假设数据发布者持有的电子化数据是原始的、未经过处理的数据.k-匿名模型提出之后,许多匿名化模型主要针对敏感属性提出了各种约束.然而,隐私保护
微网是一种可将各种分布式电源组合起来为当地负荷提供电能的中、低压小型电网,具有并网和孤岛2种运行模式,能提高负荷侧的供电可靠性.文中总结了目前世界范围内的微网发展状
针对矢量数据在授权和应用中的安全需求以及现有工作中在授权策略上存在的表达能力的不足,高可信空间数据库管理系统 BeyonDB采用一种基于谓词的矢量数据授权模型,并通过查询
随着面向服务架构、业务过程管理技术的推广应用,企业中用建模语言描述的业务过程模型越来越多,这些模型描述了企业核心的业务逻辑,是企业最宝贵的知识资产。为了更好地促进
在BICES2011展首日,南车北京时代携9大产品集体亮相,其中,最新发布的TR550型旋挖钻机成为最大的亮点,引来不少观众关注。中国南车以做轨道交通设备起家,在工程机械行业才仅有几年
随着我国科学技术的不断进步,农业、工业经济持续发展,城市建设的步伐不断加快,我国正迈进社会主义现代化建设的全新阶段.而“三农”问题是制约现代化建设的关键问题,促进农
地球的南北两端被冰雪覆盖,人们称之为极地。以北极为中心的圆圈叫北极圈。北极圈里是一片被冻结成冰的大洋,称为北冰洋,周围被陆地包围着。南极地区是一大片冰雪连天的陆地,周围被大洋所环绕,人们称之为南极洲。当