记录链接相关论文
提出了一种结合自适应字符串距离度量的记录相似度学习方法,用于多源Web数据集成中的重复记录检测。该方法使用最大熵分类器标注记......
传统的实体解析是指,给定一个或多个描述现实世界的引用集合,识别其中对应于现实世界中同一实体的所有引用的过程。实体解析是数据......
多方隐私保护下的记录链接(privacy-preserving record linkage,简称PPRL)是在隐私保护下,从多个数据源中找出代表现实世界中同一实体......
链接跨组织数据库中表示同一实体的记录,同时保护存储在这些数据库中实体的隐私,是安全有效地整合多源数据资源的核心技术之一。然......
以往的记录链接技术通常要求数据向某一方或第三方公开,常采用数据隐藏或加密技术进行隐私保护,其缺点是降低数据的准确性或不能很好......
提出了一种结合自适应字符串距离度量的记录相似度学习方法,用于多源Web数据集成中的重复记录检测.该方法首先使用最大熵分类器标注......
实体识别(Entity Resolution)是指判断一个或多个数据源中两个不同记录是否描述相同实体,它有时也被称作记录连接(Record Linkage),在......
实体解析是数据清理、数据集成、数据挖掘等技术中关键的一步,是数据质量的保障。介绍了实体解析含义、背景起源以及算法基础。列......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
21世纪是信息化高度发展的时代,各种数据不仅充斥着普通人的日常生活,更是被广泛应用于各行各业,为行业乃至社会的高效运行、发展......
记录链接的技术问题与统计理论密切相关,尤其是在建立记录链接分类规则时需要构建统计模型,识别关键变量以完成数据匹配。在贝叶斯......
大数据时代,对不同来源的数据进行整合是开展数据分析的第一步。记录链接(record linkage)是数据整合的核心技术之一。记录链接涉及......
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、......