金卫医学教育网的Web使用模式挖掘研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:dashler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Internet的迅猛发展,WWW技术已经成为了广泛应用,遍布世界各地的信息服务中心,数据挖掘技术也越来越多的应用到万维网中,于是产生了Web数据挖掘技术,Web使用模式挖掘是Web数据挖掘的重要组成部分。   本文以金卫医学教育网为研究对象,深入研究了在针对金卫网的Web使用模式挖掘过程中遇到的各种问题,并探讨了相应的处理方式。在数据预处理阶段,采用基于启发式的数据预处理算法,从而高效,准确地实现数据清洗,用户识别和路径补充。在挖掘实施阶段,通过矩阵归一化方法改进传统模糊聚类算法,有效解决了奇异数据点引起的偏差问题。通过分析金卫网Web服务器日志文件信息和数据库相关记录,采用模糊聚类分析方法,发现具有相似学习行为学员群体,相关页面和频繁访问路径。在此基础上,深入探讨了不同学员群体的行为特征,针对其行为特征,分析预测其可能感兴趣的医学资料信息,为金卫网的网站管理人员提供决策依据,使其针对不同类型的学员采取不同的宣传推荐策略,从而为医学学员提供个性化的服务。通过分析相关页面,可以帮助网站管理者发现页面间链接结构不合理的地方,以修改网站拓扑结构,方便学员访问浏览。通过分析频繁访问路径,让管理者及时发现系统瓶颈,增加预留缓存解决网络拥堵,从而优化网站结构。另外通过分析那些被频繁访问的资源以及不同类型学员的学习需求,可以对医学资源库的建设提供参考意见。   本文采用的主要方法和技术如下:⑴采用模糊处理技术,对构造的关联矩阵进行聚类分析。⑵将Web日志记录和数据库表记录结合起来,在数据预处理阶段方便数据清洗和用户识别;在模式分析阶段,便于对学员进行准确定位。   本文的特色和创新之处在于:①采用启发式规则改进数据预处理算法,有效提高了预处理阶段算法的效率和识别的准确度。②采用矩阵归一化方法将数据建模后的关联矩阵进行处理,以消除异常数据对聚类结果产生的偏差。
其他文献
基于互联网协议的语音通信(VoIP)技术将传统的基于电路交换的公用交换电话网与基于分组交换的数据通信网结合起来,利用互联网实现语音数据包的远程传输,具有成本低廉、服务内
在三网融合的环境下,业务执行环境不仅要为增值业务提供运行环境,还要提供多媒体综合的、多样化、个性化的组合式服务,并且能提供广域分布式协同的、一体化的应用协同运行能
伴随着计算机网络、通信技术的不断更新与发展,面对新时代的应用需求,传统有线网络已无法实现,渐渐地人们步入了移动无线网络时代。以往人与人之间的通信会因为地点、时间以
现在说话人识别已成为语音识别的一个研究热点。说话人识别技术是语音信号处理技术的主要应用之一。国内外许多研究机构在该领域的研究也一直在进行着。本文重点研究了基于小
政党外交辅助决策支持系统是一个智能聚类搜索系统,通过输入主题词能搜索出同主题的大量文档集合,并给出文档自动文摘的内容,方便用户快速浏览信息,及时准确地做出正确决策。
计算机与网络技术的发展与广泛应用,不仅带动了经济的发展,促进了社会的进步,而且极大地改善了人们的工作和生活方式。但是,目前利用计算机和网络进行犯罪的现象也日趋猖獗,其危害
随着科技的不断发展,数据正呈现出爆炸式增长,大数据技术也在呈迅速发展,在商业上的应用越来越广泛,但受到软件体系结构和传统数据结构的影响,使得各个应用系统之间的信息难以共享
随着计算机和信息技术的发展,现代物流业正迈入信息化、自动化的发展时代。在物流配送活动中,物流配送路径的优化作为物流配送系统优化中关键的一环,是物流领域亟待解决的热
本文研究了正交多幕光线散射补偿算法。投影机将图像投射到不同的屏幕上,屏幕上的光线会在光的散射作用下投射到与之相邻的屏幕上,使部分画面出现色彩增强和颜色不连续问题。
特征提取是人脸识别中的最基本的研究工作之一,其本质是将高维原始数据投影到更有利于分析的低维空间中。特征提取的经典算法有主分量分析方法,局部保持投影和边界费舍儿方法