基于XML的信息管理系统的数据集成技术研究

被引量 : 0次 | 上传用户:LALOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术及其应用的快速发展,XML已经成为互联网上信息表示和数据交换的一个重要标准,XML在电子商务、数据交换、科学数据表示、数据建模与搜索引擎等领域有着广泛的应用,其作用已深入到网络社区的每个角落;而且当前数据库的发展呈现三个主要特征:支持XML数据格式,具有商业智能,支持SOA(服务导向架构)。随着大量XML数据的涌现与传递,产生了对XML数据管理的需求,因此如何有效地表示、存储、管理、查询与挖掘这些XML数据或数据流已成为当前XML数据库领域中一个重要挑战,具有十分重要的理论和应用价值,本文正是基于此背景研究XML数据智能管理的。本文围绕XML数据/数据流的表达、查询和聚集等问题展开研究,研究内容和取得的成果主要体现在数据智能清洗与查询方面:数据清洗是提高数据质量、并提高数据查询效率的一种有效手段。随着互联网的发展,XML数据智能清洗与查询的重要性逐渐为人们所认识;针对以往XML数据清洗检测繁锁及灵活性差的缺陷,本文尝试通过合理组合XML键、融入粒子群算法、通过引入贝叶斯学习方法及隐马尔可夫模型信息抽取策略构建XML数据清洗过程的元数据模型,综合清洗结构化数据中相似重复记录的思想,提出一种利用粒子群算法改进XML数据清洗的新方法;同时引入群智能算法提高XML数据查询的智能性与有效性,特别是粒子群算法具有快速随机的全局搜索能力,但无法利用反馈信息,而蚁群算法通过信息素的累积和更新收敛于最优路径上,具有分布式并行全局搜索能力,但初期信息素匮乏,求解速度慢等特征,采用启发式方法,结合XML半结构化的特点,将粒子算法与蚁群算法融入于XML概率查询上,并进行相应的改进,采用粒子群算法快速生成信息素分布,利用蚁群算法精确求解,达到优势互补,提高数据查询的范围和收敛的效率。
其他文献
<正> 由武汉大学氨基酸研究室于该校六十八周年校庆期间倡议召开的氨基酸学术报告会,于1981年11月10日至13日,在武昌珞珈山举行。中国科学院、军事医学科学院等科研单位;第二
目的:探讨心理护理干预对肺结核患者影响。方法:选择204例肺结核患者,随机分为实验组和对照组各102例。对照组采取规范治疗加基础护理,实验组在规范治疗的基础上对患者的心理
<正>很多年前,柴继军还是个摄影记者和图片编辑。他每天处理全国各地摄影师用特快专递寄来的照片,但由于题材和版面所限,实际上能用的只有十分之一甚至更少,剩下的往往会被扔
期刊
晏殊的词作没有关乎国家兴亡的重大题材,没有慷慨激昂的豪情抒发,他的《珠玉词》闪耀出的是一种诗意的生命之光,是对人生价值进行“诗意”思考的艺术结晶。其为人称道的小令
本文主要对鱼粉的特性进行了系统研究。包括鱼粉的物理化学特性、加工(粉碎和贮藏)对其特性的影响以及鉴定鱼粉掺假方法的初步探讨等。文章首先对国内鱼粉中较有代表性的台州
本文从不同层面阐述了我国"十二五"期间企业实施兼并重组的必要性,并提出了实施兼并重组需要注意的四个要点。
业务招待费是指纳税人因生产经营活动的合理需要而发生的应酬费用。现行《企业所得税法实施条例》对业务招待费的税前扣除有严格规定。因此,企业需加强对业务招待费的税务筹
本文以福建省泉州市中小民营企业为例,在对中小民营企业人才流失现状进行分析的基础上,总结出家族式管理弊端、人力资源管理制度不完善和管理者素质水平有待提高等方面的人才
现代标志设计很多以中国传统吉祥图案为设计元素,表明了当今设计对传统文化精神的需要。本文试图通过研究现代标志设计如何借鉴传统吉祥图案的问题,来探索当今标志设计在融合
药用玻璃化学稳定性探讨品辉昆明保温瓶厂药用玻璃分厂1、引言在普通的玻璃容器中,长期贮存药物时,往往因微量的碱性物质溶出造成变质甚至危害人体健康,这就要求药用玻璃有较好的