【摘 要】
:
数据库集成时会产生大量的相似、重复记录,字段匹配算法是对其进行检测并清洗的主要方法之一.针对等级法确定属性权值主观性过强的问题,提出改进的基于二次模糊评判的检测方
【基金项目】
:
福建省教育厅科技项目(JB14129)
论文部分内容阅读
数据库集成时会产生大量的相似、重复记录,字段匹配算法是对其进行检测并清洗的主要方法之一.针对等级法确定属性权值主观性过强的问题,提出改进的基于二次模糊评判的检测方法.根据等级法对属性进行第一次评判,剔除等级低的部分非重要属性;对剩余属性进行二次模糊评判,平均属性等级评判的结果,确定属性权值,然后对数据集进行分组,并在各个数据集中检测相似重复记录.理论分析和实验结果表明,该方法不仅提高了运行效率,而且可以进一步提高查重的查准率和查全率.
其他文献
2008年9月至2010年6月期间,我们应用自拟清浊方治疗胆汁反流性胃炎89例,取得满意疗效,现报道如下:
目的:评价18FDG-PET诊断卵巢癌治疗后复发的价值.材料和方法:对20例临床疑有复发的卵巢癌患者进行了18FDG-PET全身及腹部成像,并与CT、B超及CA125等进行比较.结果:9例PET与CT
近年来,无锡广电集团在推动媒体融合发展中,注重发挥传媒产业建设作用,有效提升内生动力和发展活力,提高竞争力和影响力,为巩固壮大主流思想舆论阵地奠定了坚实的基础。本文
先从简单的单肋拱出发,分析了拱肋倾角对单肋拱的弯矩影响,进而研究了不同拱肋倾角(垂直、内倾、外倾)对3跨自平衡中承式系杆拱桥的拱肋、系杆、吊杆静力的影响。