论文部分内容阅读
近年来,基于网络的应用系统规模和数量呈现快速增长,应用系统的运行效率和适用性出现瓶颈。完善系统相关的业务流程和规则、提升系统技术架构和性能具有重要意义。通过采集用户行为数据,分析用户行为中的衍生信息,可以为制定完善业务流程,优化系统结构的策略提供可靠数据依据。本文描述了一种面向教育电子政务系统的用户行为分析模型和分析方案,并对提出的方案进行了实现。 论文介绍了网络应用系统中用户行为的基本特点,分析了用户行为的表示方法,相似性和划分策略。描述了一种用户行为分析模型,通过依赖确定目标数据集,通过关联分析用户行为关系,通过分类分析行为数据分布,根据关联分析发现行为规律,为业务调整和系统优化提供依据。并以此为基础,描述了一种面向教育电子政务系统的分析方案。 论文依照提出的分析方法和分析模型,在开源的分布式数据处理框架Spark上实现了以改进业务和优化系统架构为目标的用户行为分析方案。通过使用Spark的结构化数据处理模块SparkSql和机器学习算法库SparkMLlib对数据结果进行了处理和挖掘。最终,针对得到的数据结果进行了用户组别分析,提出了改进实际问题的方案,证实了本文提出的用户行为方法和行为分析模型的可行性。