论文部分内容阅读
电子政务是我国信息化的重点之一,对于中央和地方政府门户网站的建设,能够有效的推动政府向民众提供公共服务。然而我国现有的政府门户网站都是以其提供信息和服务的数量作为主要指标来评价,网站在设计时很少考虑用户的接受和使用。用户的访问方式常会与网站的设计意图产生冲突,导致用户访问不便。可用性是从用户的角度来衡量网站的质量,它是用户使用网站过程中影响用户体验的所有因素的组合。对于网站可用性评价的传统方法有很多,如专家评估、田野观察、访谈、问卷等,但这些方法几乎都是研究一些有代表性的用户,而不是对全体用户的分析。对网站日志数据的挖掘,则可以从侧面来分析网站的可用性。网站服务器存储大量用户访问行为的数据,通过对数据进行分析和挖掘来可以发现许多用户访问的模式和规则,而这些模式和规则是对网站可用性最客观的体现。因此挖掘和分析网站用户的行为数据对改善网站可用性来说至关重要。本研究提出应用数据挖掘技术对网站日志文件进行分析的方法,根据日志中的IP等信息来固定用户的访问,重建用户访问过程,形成用户访问会话,对其进行数据挖掘,以探索用户的访问模式,对应网站可用性等问题,进而辅助政府网站进一步提升。本研究以浙江省人民政府网为研究对象,以提升政府门户网站可用性为目的,作了如下研究并得到相应结论:第一,介绍了WEB日志数据预处理的过程及数据预处理方法,通过算法将政府网站的WEB日志数据进行清洗、整合形成用户会话,以符合数据挖掘的要求。第二,对几种网络使用挖掘算法作了分析,并对会话数据进行了数据挖掘,发现用户访问模式。第三,对得到的模式进行可用性分析,发现网络使用挖掘和可用性指标间的联系,得出政府门户网站所存在的可用性问题,提出改进意见。数据挖掘作为一种十分有效的手段,能帮助网站开发者从用户的实际使用中发现网站中存在的可用性问题,最终提升政府网站的设计。