论文部分内容阅读
科学数据库经过二十多年的发展,积累了大量的数据资源。随着网络技术的发展和科学研究的进步,科学数据库将成为科研工作的基础设施之一,并将成为未来科学研究必不可缺的资源。作为中科院科学数据库系统的运行、管理和技术支撑单位,从整体上把握各个科学数据库的实际使用情况以及用户对各个数据库的访问模式,保证各个数据库的高效数据服务是科学数据库中心的主要任务之一,同时也是高层管理人员急需掌握的内容。
本文从科学数据库门户网站的自身特点出发,利用数据挖掘等先进技术对大量的用户访问信息进行深入的处理和分析,挖掘用户的访问模式、分析用户的访问途径,为高层管理人员从整体上把握科学数据库的访问情况,了解用户的行为模式,掌握各个科学数据库之间的关联性提供科学依据。
本文首先简要地介绍了研究背景和研究目标,然后对数据挖掘技术进行了基本概述;接着介绍了Web挖掘及其分类并对Web使用挖掘的相关情况进行了阐述;然后对基于科学数据库门户网站的Web使用挖掘的总体流程及关键技术进行了详细说明,并对各个阶段的处理结果进行了分析;接下来对用户访问途径分析中的关键技术进行了阐述,包括对各种搜索引擎的调研和对各搜索引擎来源进行统计分析;最后是总结和对下一步研究工作的展望。
本文的研究成果主要体现在,利用数据挖掘技术对科学数据库门户网站的用户访问信息进行深入分析,掌握了用户对各个科学数据库的访问模式,揭示了科学数据库之间的关联性;对用户的访问途径进行分析,了解用户从各种搜索引擎对科学数据库门户网站的访问,为改进网站的内容,提高网站的权威性提供了科学依据。