一种基于主动学习的相似记录匹配方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:HUANGKAO2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前相似记录匹配方法中存在的问题,提出一种改进的机器学习匹配方法。该方法聚类相似记录,生成决策树学习委员会,由学习委员会主动挑选信息量最大的相似记录,由用户标注匹配结果后对学习委员会成员进行训练,自主学习不同数据源问相似记录匹配规则。实际数据的实验分析验证了该方法可以在有效减少训练实例数量的同时获得较高的匹配精度。
其他文献
信息时代下,社会发展对应用型、创新型人才的需求逐渐增加,高职院校间的竞争也越来越激烈。为提升学生就业能力,在高职院校计算机类课程教学过程中,必须突出'以就业为导
随着经济的发展,人们膳食结构和生活方式的改变,我国居民的疾病谱也发生着急剧的变化。普通教育系统职工是人群中文化层次相对较高、工作比较繁忙的一个群体,他们的健康状况和精