【摘 要】
:
与正序列模式挖掘相比,负序列模式挖掘不仅考虑了已经发生的事件,还考虑了未发生事件,它能够在单纯的正序列模式挖掘可能会误导决策时辅助决策。并且现有序列模式挖掘算法在应用时的各项目具备同样的重要程度,这是不切实际的,权重的提出使这一问题得到了解决。本文提出了一种基于加权正负序列模式的数据挖掘算法,在挖掘过程中为项目设置不同的权值,各序列的加权支持度与最小支持度对比得出频繁序列模式,算法应用在学生数据时
论文部分内容阅读
与正序列模式挖掘相比,负序列模式挖掘不仅考虑了已经发生的事件,还考虑了未发生事件,它能够在单纯的正序列模式挖掘可能会误导决策时辅助决策。并且现有序列模式挖掘算法在应用时的各项目具备同样的重要程度,这是不切实际的,权重的提出使这一问题得到了解决。本文提出了一种基于加权正负序列模式的数据挖掘算法,在挖掘过程中为项目设置不同的权值,各序列的加权支持度与最小支持度对比得出频繁序列模式,算法应用在学生数据时运用K-均值聚类方法进行建模仿真。实验结果表明该方法有效提高了数据挖掘的效率和准确度,很好地展现了数据挖掘技术在数据分析方面的应用,实用性强。随着数据挖掘技术的快速发展,产生了海量的高校信息数据,这些复杂的信息中隐藏着许多有价值的信息。如何充分利用高校的信息资源,挖掘出有价值的信息,是目前高校研究的热门课题。前人对于高校数据进行挖掘时大多采用决策树、关联规则等挖掘方式,很少使用序列模式挖掘方法。存在的问题是,这些研究方法在突出数据重点等方面存在一定的不足。本文通过基于加权正负序列模式方法在高校数据中的应用,弥补以上不足的同时更好地通过学生的在校行为分析得出优秀学生培养规律,并对不同类型学生进行针对指导。
其他文献
作为出色的文学家,海明威有自己独特的创作理论,其冰山理论认为,在文学作品中,文字和形象是所谓的"八分之一",而情感和思想是所谓的"八分之七",研究文学作品一定要明白隐藏在
本文介绍了C-327、W-1143、W-1210三台重力仪于1984年10月在武汉的气压试验结果,给出了重力段差值的气压改正公式,介绍了兰州—天水—武都重力网测量结果的气压改正概况。
T
慕课(MOOC)是一种正在完善和发展的新兴网络教学课程,它的兴起迎合着大数据时代,乃至人工智能时代的需求,已经成为全球众多名校积极探索的教学模式。慕课的出现,无疑促进了教
在大数据模式背景下,企业财务会计自动化的水平不断提高,使得企业对于财务人员的要求也随之增高,引起了会计行业变革以及高效财会教育模式的变革。目前高校财会教学中存在着
介绍了某电机定子冲片扣点式复合模的结构设计、工艺方案分析、装配工艺要点。解决了该类模具技术难题,满足了该冲片的精度要求,达到了冲片的叠压技术要求,模具结构简单,维修
<正>3月22日,5家高科技公司携新品或解决方案亮相CCBN2019新闻中心新品发布系列活动。谐云科技推介了容器云PaaS,围绕PaaS平台,谐云科技打造了其核心产品集,包括业务级性能监
2004年初,陕西煤业化工集团在国企改革大潮中应运而生,经过15年的改革发展,陕煤集团已成为拥有60多家全资和控股企业、有3家上市公司的国有特大型能源化工企业。2018年,陕煤
细菌性脑膜炎是一种重要的致死性传染性疾病,致脑膜炎大肠杆菌(Escherichia coli,E.coli)是其主要病原,破坏血脑屏障(blood-brain barrier,BBB)是E.coli引起脑膜炎的关键步骤。BBB能够通过控制相关物质的进出使中枢神经系统(central nervous system,CNS)免受血液中的毒素和病原体的侵害。BBB主要由脑微血管内皮细胞(brain mi
为提高纺织用α-淀粉酶的退浆效果和延长其保存时限,利用α-淀粉酶对棉织物进行退浆,讨论了最适温度、最适p H、酶液质量浓度对α-淀粉酶退浆效果的影响。以退浆率为指标,研
随着通信事业的蓬勃发展,电信市场竞争日益激烈,一方面为了满足用户日益增长的需求,通信设备和技术时常更新换代,另一方面是通信企业机房周边环境的城市化建设的影响,使得通