基于深度学习的校园网访问量预测模型研究

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:wangjuekenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下数据是重要的资源,数据是构建预测模型的关键。计算机采集信息形成大规模数据,这些数据中蕴含着很多有用的价值,校园网的日志数据就是很有价值的数据。校园网通常使用Nginx部署反向代理服务器,记录了校内和校外用户访问校园网站的日志数据。反向代理服务器采集的日志数据包含用户IP、访问时间、请求的URL和HTTP协议、发送给用户主体文件内容的大小,从哪个页面链接访问过来,兼容性和浏览器信息等内容。深度学习成为人工智能领域近些年以来兴起的一个新领域,它可以看做是机器学习研究领域的一个新扩展,并且是对人工神经网络的延续发展,其目的在于构建多个处理层从海量数据中自动完成数据特征的学习。提取并学习数据特征成为构建预测模型的关键。本文将分析反向代理服务器中的日志数据,提取必要的日志数据特征,利用深度学习自动学习数据特征,构建校园网访问量预测模型。构建的预测模型实现预测不同地区访问校园网的数量,从而能够在推荐或者决策上体现数据的价值。主要的研究内容和研究成果总结如下:(1)数据预处理。对从Nginx部署的反向代理服务器中获取的日志数据按不同类别进行数据整理;数据清洗完成去除日志数据中无效信息;在有效的会话信息中进行数据选择,选择与数据分析相关的数据类别;数据处理完成IP地址的地区转换,最后将处理的日志数据特征统一数据格式并存储到数据库中。数据预处理完成了数据特征的获取,为后面完成模型训练提供数据集。(2)模型构建。处理好的日志数据作为数据样本,构建校园网访问量预测模型。利用深度学习中DBN(Deep Belief Network,深度置信网络)模型对数据进行预训练,并在DBN网络基础上添加回归层完成预测,构建基于DBN融合SVM(Support Vector Machine,支持向量机)的混合预测模型DBN_SVM,预测不同地区访问校园网的数量;然而深度学习中的LSTM网络在处理时序数据中具备很大优势,构建基于LSTM(Long Short Term Memory,长短时记忆)网络的校园网访问量预测模型,完成同样的预测任务。使用Nginx反向代理服务器采集的日志数据设计实验数据集,调整模型参数,分别使预测效果达到最佳。在相同的日志数据集下,实验对比构造的两个预测模型,基于LSTM网络的校园网访问量预测模型有较好的预测效果。(3)模型应用。利用基于LSTM网络的预测模型实现在高考招生上的应用,预测出全国不同地区在特定时间段访问学校招生网站的数量,根据访问量差异计算出全国不同地区报考学校的意愿度。不同地区的报考意愿度会对高考招生名额分配产生影响,意愿度高的地区应该分配更多的名额。因此,计算出的报考意愿度能给学校在高考招生名额分配上提供推荐(建议),体现出预测模型在招生应用上具有一定的应用价值。
其他文献
<正>2月20日,海淀区政协副主席、区总工会主席胡淑彦,再次来到海淀区西苑挂甲屯社区调研指导防疫工作并看望一线值班值守人员。西苑挂甲屯社区,面积大、人口多,人员进出频繁
企业年金是我国多支柱养老保险制度的重要组织部分,如何确定企业年金的缴费水平既影响养老保险制度的福利水平,也会对就业人口产生重大影响.本文在劳动工资外生给定的情况下,
针对蜀冈中西峰生态修复工程山体堆筑体量大、地势落差大、环境复杂等特点,应用FLAC3D软件建模分析加筋挡土墙、土工格栅与填筑物的整体稳定性及稳定系数。通过动态监控手段,
据市场研究机构IHS统计,全球能源储存系统的设备容量将从2015年1.4GW/h大幅增加到2016年2.9GW/h,增长率超过100%。以个别国家来看,到2025年时,中国、美国、日本将是全球能源储存系统安
<正>2011年,我在学校领导和同事的帮助下,申报并立项通过了"十二五规划"中《自主、探究、合作学习策略研究》的一个子课题《以小课题研究为载体,培养初中学生创造思维能力的
如何正确处理集中办学与分散办学、兼顾公平与效率、重点支持集中办学又适当照顾分散的校点、协调区域内经济发达地区与边远贫困地区教育的均衡发展等,是农村中小学布局调整过
FAD依赖的葡萄糖脱氢酶(FAD-dependent glucose dehydrogenase,简称FADGDH,EC1.1.99.10)能够在NAD(P)+等存在的情况下催化β-D-葡萄糖生成葡萄糖酸和NAD(P)H。由于其具有对热稳定
目标教学法是基于目标管理理论基础上的教学方法,是一套系统、科学、实用、有效的课堂教学方法,在近年的教学实践中被广泛应用。医护专业英语是涉外护理专业学生必须掌握的基
干挂石材幕墙作为建筑的表皮材料在现代建筑中得到广泛应用,它的发展过程与技术的进步息息相关,新材料、新技术是其实现其合理性的保障条件;尽管如此,干挂石材幕墙的应用及存
本文基于国内外环境规制与FDI的研究成果,以制造业FDI作为被解释变量,环境规制作为解释变量,经济发展水平、工业化水平和制造业劳动力成本作为控制变量,构建了环境规制影响制