【摘 要】
:
论文首先介绍了WEB挖掘和信息检索的概念、相关技术以及国内外发展现状与趋势,描述了现今常用的WEB挖掘方法和工具,提出并实现了基于WEB挖掘和多层次数据库的综合智能化WEB挖掘
论文部分内容阅读
论文首先介绍了WEB挖掘和信息检索的概念、相关技术以及国内外发展现状与趋势,描述了现今常用的WEB挖掘方法和工具,提出并实现了基于WEB挖掘和多层次数据库的综合智能化WEB挖掘引擎系统—IWMES(Intelligent WEB Mining Engine System)。该系统通过Web Services技术,建立在现有搜索引擎基础之上,以XML技术解决了多样性和非结构性的WEB数据转换,形成了WEB多层次数据库,利用了WEB挖掘面向结构化或半结构化数据的智能化数据抽取和知识发现过程,并且构造了数据仓库的高性能查询体系结构—HPQS,利用MIDAS技术形成了高性能索引库结构,弥补了当前搜索引擎在覆盖范围、准确率、复杂查询语言的使用和结果表现方式等方面的不足,改善了信息检索的效率。 本文阐述了系统的体系结构,说明了索引库、WEB多层次数据库、数据仓库、数据收集器、数据预处理器和综合数据挖掘器等组成部分的基本功能。并且详细介绍了该系统的实现原理、系统构架以及索引库、WEB信息资源搜索、多层次数据库、数据仓库、数据预处理和数据挖掘等功能模块的构建,并结合模块的功能实现流程图,陈述了整个系统的实现过程。尤其详细介绍了在系统中所使用的数据仓库模块的设计、实施以及OWB软件体系结构的实现,并给出了相应的软件流程图、模块功能结构图、实现方法和部分程序代码,以及系统实现过程中所用到的部分算法。
其他文献
综述慢性乙型肝炎肝硬化血小板减少患者的血小板相关指标、肝纤维化指标、血小板生成素等各项指标的研究及各指标间的相互联系,以了解其研究进展,以便更深层次的探讨慢性乙肝
<正>早在1937年,德国化学家Otto Bayer发现异氰酸酯与活泼氢化合物(如多元醇)的加成反应,便可制得聚氨基甲酸酯,简称聚氨酯,它是含—NHCOO—单元结构的高分子化合物,由此奠定
蔡林记的热干面,老通城的豆皮,四季美的汤包和小桃园的煨汤被誉为是武汉的四大名小吃,深受广大人民的喜爱和肯定。随着武汉的快速发展,来到武汉的外国友人与日俱增。品尝武汉
但丁是意大利中世纪最伟大的诗人。他的文学创作标志着中世纪文学向近代文学的过渡。《神曲》是他一生思想和艺术探索的结晶,也是整个中世纪欧洲文艺美学思想的总结性作品。
信息化技术在教学中的合理运用,不仅有利于学生对知识的掌握和自身能力的提高,而且有利于教师职业能力的提升。文章以中职建筑CAD教学为例,论述了信息化技术在课堂教学中的应
通过对十几首英译唐诗的鉴赏,探讨了模糊限制语在其的语用功能。第一:用以表示不确定的数量、范围、距离以及时间;第二:用作夸张、对比、比喻等修辞;第三:用以获取美学效果。
<正>随着我国工业结构改变与技术水准不断提高,对外贸易高度增长,同时竞争日趋激烈以及顾客的要求日益严格,国内企业更加重视提高生产力。而传统的管理的办法,管理的好坏、管
目的观察特利加压素和托拉塞米治疗失代偿期肝硬化和非顽固性肝硬化腹水的疗效。方法选择2011年2月到6月于我院住院的失代偿期肝硬化患者36例,按2000年中华医学会传染病与寄
贵州省养生旅游资源丰富,但如何转化成养生旅游产品,是当地政府、企业、居民共同关心的课题。借鉴国内外较成熟的养生旅游开发模式,结合贵州省情,给出了贵州养生旅游产品开发