一种基于主动学习的相似记录匹配方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：HUANGKAO2

【摘要】

：

针对当前相似记录匹配方法中存在的问题，提出一种改进的机器学习匹配方法。该方法聚类相似记录，生成决策树学习委员会，由学习委员会主动挑选信息量最大的相似记录，由用户标注匹配

【作者】

：

陈波王延章

【机构】

：

大连理工大学管理学院,中国人民银行征信中心

【出处】

：

计算机工程

【发表日期】

：

2009年3期

【关键词】

：

信息集成相似记录匹配主动学习决策树 information integration similar records matching active lea

【基金项目】

：

中国人民银行信息化建设基金资助项目“统一征信平台研究”（P2008035）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对当前相似记录匹配方法中存在的问题，提出一种改进的机器学习匹配方法。该方法聚类相似记录，生成决策树学习委员会，由学习委员会主动挑选信息量最大的相似记录，由用户标注匹配结果后对学习委员会成员进行训练，自主学习不同数据源问相似记录匹配规则。实际数据的实验分析验证了该方法可以在有效减少训练实例数量的同时获得较高的匹配精度。

其他文献

以就业为导向的高职计算机教学模式优化策略探析

信息时代下,社会发展对应用型、创新型人才的需求逐渐增加,高职院校间的竞争也越来越激烈。为提升学生就业能力,在高职院校计算机类课程教学过程中,必须突出'以就业为导

期刊

就业导向高职计算机教学模式

宣武区2002—2007年教育系统职工常见病年龄特征分析

随着经济的发展，人们膳食结构和生活方式的改变，我国居民的疾病谱也发生着急剧的变化。普通教育系统职工是人群中文化层次相对较高、工作比较繁忙的一个群体，他们的健康状况和精

期刊

高血压脂肪肝肥胖症血脂异常全体教工院校

一种基于主动学习的相似记录匹配方法

与本文相关的学术论文