【摘 要】
:
为了解决传统字段匹配算法未能根据数据源数据特征进行匹配函数调整的缺陷,提出了一种基于关联token操作和支持向量机的自适应字段匹配算法。该算法使用关联操作集形式化描述
【机 构】
:
大连理工大学管理学院,中国人民银行征信中心
【基金项目】
:
中国人民银行信息化研究基金项目(P2009072)
论文部分内容阅读
为了解决传统字段匹配算法未能根据数据源数据特征进行匹配函数调整的缺陷,提出了一种基于关联token操作和支持向量机的自适应字段匹配算法。该算法使用关联操作集形式化描述字段间的相似性,提出了一种改进字段相似度计算的Cosine式,将关联操作集转换为描述字段相似度的规一化向量值,并设计了基于SVM学习的字段匹配算法。最后对实际实验数据进行了分析,结果表明了该算法对于不同数据质量的数据源都可取得较好的匹配精度。
其他文献
党的八大宣布社会主义经济制度基本上建立后,毛泽东的《正处》为襁褓中的社会主义制度注入了强大的生命力,为社会主义基本制度的确立奠定了坚固的理论基石;八大后开展的政治
现如今的冶金企业在工作过程当中存在着效率低、危险性大的问题。为了解决此类问题提出基于西门子PLC技术的冶金企业自动化控制技术研究,通过PLC技术的运用,实现物料跟踪、设
<正>在电子商务的快速发展过程中,各种电子商务模式的弊端逐渐显现,纷纷遭遇发展瓶颈。信息技术和通讯技术的高速发展使电子商务成为区域经济发展的重要推动力。电子商务不仅
电视媒体求职作为一种新兴的求职方式,吸引了大批的求职者,也对大学生的就业带来了巨大的影响。本文通过采用简单的统计工具进行描述统计分析,找出目前电视媒体求职的改进空
目前我国社会经济发展正处于重大转型期,过去支撑我国经济实现赶超的银行主导型并由政府控制价格的金融模式迫切需要改变。在互联网已经并将继续改变我们的生产方式和生活方
目前,我国会计人员的素质与知识经济时代的要求很不适应。文章通过分析会计人员素质的现状,提出了提高会计人员素质的对策。
建立了采用快速溶剂萃取-离子色谱同时测定塑料中三价铬和六价铬的方法。三价铬和六价铬分别以吡啶-2,6-二羧酸(PDCA)和1,5-二苯卡巴肼(DPC)作为络合剂在柱前和柱后进行衍生
目的探讨事件相关电位在评估帕金森病轻度认知功能障碍(PD-MCI)中的价值。方法选择PD患者110例,根据神经心理学测验评估结果分为PD-MCI组45例和认知正常组(PD-CN组)65例。另选择同
由于多钽酸盐仅能在强碱性条件下稳定存在,所以几十年来发展缓慢。而Ta/W混配型多酸可以在酸性条件下稳定存在,是含钽多酸发展的突破点,因此研究Ta/W混配多酸对含钽多酸的发
针对南堡3号构造区中深层东营组二段(Ed2)-沙河街组三段(Es3)沉积类型认识的不统一,在研究区8口取心井岩心观察描述的基础上,结合地震、测井、录井及岩矿等资料,对南堡3号构造区