基于素数的多源模式匹配方法的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:wzmuyelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的普及,出现了很多基于Web的可检索的在线数据库,其中隐藏了大量的信息,我们称之为“深网(DeepWeb)”。这些可检索在线数据库的出现给数据集成领域带来了许多新的问题,而模式匹配是数据集成过程中的一个关键操作。对隐藏的海量数据的集成首先要对各在线数据库源查询界面使用的模式完成匹配。本文对国内外关于模式匹配的研究现状进行了综合分析,从一个全新的角度对大规模在线数据库查询界面进行匹配的模式匹配方法进行了研究。 首先,介绍了多源模式匹配方法和一般模式匹配方法的异同点,深入分析了现有的两种多源模式匹配方法,指出了两种方法各自的优点和存在的不足。 其次,在两种方法的基础上,提出了一种基于素数的多源模式匹配方法。将素数理论引入到模式匹配过程中,将属性间单纯的字符匹配转换成数学运算,提高了匹配效率,并保留了现有多源模式匹配方法的优点。该方法弥补了当前研究中无法完成复杂匹配的同时保留模式模型的不足,方便了后续元查询系统的设计。 再次,分别提出了属性素数化算法、组属性挖掘算法、同义词发现算法和匹配选择算法,同时提出了基于素数的多源模式匹配方法的具体实现算法,并给出了相应的算法分析。 最后,在四个领域200多个实际在线数据库源上进行了实验,分析了实验结果,证明了算法的正确性。
其他文献
本文研究的内容集中在Rough集理论,以及Rough集理论中的粒度计算理论在数据挖掘领域中的若干应用。Rough集理论是一种处理不确定性知识的数学工具,围绕着数据挖掘领域中的问题,
随着网络技术的发展,特别是Web的主流化,企业应用系统逐渐的由封闭状态走向开放,企业应用面对的信息资源将越来越依赖于Web环境,从而使得以基于J2EE企业应用系统为代表的网络
客户关系管理(Customer Relationship Management,CRM)旨在改善企业与客户之间关系的新型管理机制。随着文明的进步和社会的发展,人们对政府服务也有新的要求。例如希望以自
随着网络信息的日益庞大,人们常常为了查询某一信息而不得不从庞大的信息中人工进行搜索和挑选工作,所以使用Agent,Web挖掘等技术为访问Web网页的用户提供方便快捷的智能辅助浏
传统EAI通常采用紧耦合的集成方式,具有扩展性差、维护困难、集成代价高等缺点。基于Web服务的应用集成具有简单、灵活性高、扩展性强、稳定性好和标准开放等优势,但标准Web
建立闭环故障报告、分析和纠正措施系统(FRACAS)已经成为企业实现产品可靠性维修性增长的重要手段。工作流技术是目前发展比较迅速的技术,其主要特点就是采用计算机技术,使业
随着Internet的广泛应用而兴起的IP电话,正以其低廉的通话费用及其诱人的市场前景对传统电信业务形成猛烈的冲击。在中国的IP电话领域中H.323已被广泛应用。同时也应看到SIP
GALS(Globally Asynchronous Locally Synchronous)思想提出:从局部而言,芯片内部的各模块采用同步电路设计方法;而从全局而言,各模块彼此时钟异步,以各自工作频率独立运行,整块芯
随着Internet的不断发展,人们越来越多地从网上下载并使用程序,程序信息流安全问题越来越重要。程序信息流安全问题是指程序能否保护重要数据的机密性和完整性。数据机密性的保
移动自组网是一种不依赖任何固定基础设施的无线移动多跳网络,正被越来越多地应用于军事、紧急救援、家庭娱乐等各种领域。这种网络除具有移动性、动态性、多跳性、临时性、自