利用有序互信息匹配包含非透明列的数据模式

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:xinmo2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据模式匹配是异构数据源数据合并过程中的核心环节,属于数据集成中的关键问题。目前已有许多数据模式匹配方法,但其中很大一部分方法由于过多依赖数据模式描述信息,导致通用性不足,很难应用于其他场景中。为此,提出了一种利用有序互信息的匹配包含非透明列名和列数据值的数据模式。该方法不依赖诸如列名、列类型、主外键依赖等数据模式描述信息,因此具有很强的通用性。在多个数据集上实验结果表明,该方法能够在大幅降低匹配花费时间的同时提高匹配结果的准确率。
其他文献
目的探讨基质金属蛋白酶(Matrix metalloproteinases,MMPs)在大肠癌、甲状腺乳头状癌和膀胱移行细胞癌中的表达,及其与肿瘤生物学行为的关系.方法采用免疫组织化学方法,测定M
目的通过对支气管动脉灌注(BAI)治疗肺癌及经支气管动脉、肺动脉双介入治疗肺癌的生存期随访,探讨支气管动脉灌注及双介入治疗肺癌的临床价值.方法68例肺癌病人随机分为2组,3