【摘 要】
:
实体识别(Entity Resolution)是指判断一个或多个数据源中两个不同记录是否描述相同实体,它有时也被称作记录连接(Record Linkage),在数据集成中被用于数据清洗(Data Clean)、去重(D
【基金项目】
:
国家自然科学基金(61472070,61672142)
论文部分内容阅读
实体识别(Entity Resolution)是指判断一个或多个数据源中两个不同记录是否描述相同实体,它有时也被称作记录连接(Record Linkage),在数据集成中被用于数据清洗(Data Clean)、去重(Deduplication)和相似连接(Similarity Joins)等集成操作中.实体识别技术可被广泛应用于人口普查、引文识别、Web搜索、数据清洗以及剽窃检验等诸多领域.然而,在真实世界中,实体的属性会随着时间的变化而变化,两条记录的属性值不同不能表明这两条记录对应不同的实体,具有相同
其他文献
对悬浮粒子和空化泡间的相互作用进行了理论分析,得到了气泡内外n=0模式(脉动)和n=1模式(平动)相关的微流分布.利用Matlab软件对微流分布绘图,数值分析结果表明:由于悬浮粒子的影
目的建立快速酸浸提-石墨炉原子吸收法测定大米中镉的方法。方法过80目筛得大米样品,以0.5%硝酸溶液直接稀释,充分摇匀后静置30 min,取上清液上机进样,石墨炉原子吸收法测定
20世纪以来,各个国家和地区都在探寻符合自己国情的产学研合作开发模式.从对国内外先进模式及其特点研究可知,创造有利于创新的外部环境,坚持以市场为主导,鼓励民间风险投资,
<正>日本一个研究小组最新发现,多吃豆腐、纳豆等豆制品的孕妇患抑郁症比例较低,这可能是大豆中的异黄酮发挥了作用。日本爱媛大学日前发布公报,该校和东京大学等机构的研究
中小企业经济带动社会经济的持续性发展,同时又为社会各个工作层面增加了就业机会,进一步响应了可持续发展策略。但中小企业发展过程中又遇到企业融资难的问题,以影响企业的
目的:通过检测60例非小细胞肺癌和20例癌旁正常肺组织程序性死亡配体1、Toll样受体4的表达情况,探讨PD-L1、TLR4在非小细胞肺癌的表达是否具有相关性及PD-L1和TLR4与非小细胞
我国著名道家学派创始人老子提出的"无为而治"思想,被广泛应用于各种管理活动中,本文基于刚刚迈入大学校园的00后大学生的心理特征,从高校班级管理者的角度,分析了"无为而治"
所谓"发展升级",主要是指现代社会在经历了一系列重要的发展阶段转换和指标提升后所达致的一种较高的发展状态。作为发展理论的核心概念,发展升级主要包括发展阶段间相互衔接