论文部分内容阅读
关联分析作为一门发现大量数据之间有趣的关联关系的重要技术。目前已经被应用到商业、电信、金融、农业、医疗等领域,并取得了良好的效果。而当前机动车数量的增加已经导致各类交通事故的频繁发生,针对已发生事故的关联分析并根据关联规则进行事故预测可以为相关部门提供信息来更大程度的避免交通事故的发生。本文工作的目的是研究一种效率更高的关联规则挖掘算法,建立一个在不平衡数据集下也能保证其准确率的关联分析预测模型,并将模型应用于交通事故预测中。论文的主要工作内容包括如下几点:(1)提出一种改进的关联分类规则挖掘算法。本文提出了一种改进的等价类规则树结构来进行关联规则挖掘,基于等价类规则树利用先验思想和diffset策略实现对规则的深度剪枝,从而缩短算法的运行时间。(2)提出了一种基于多源数据的关联分析预测模型。本文采用多种度量与多准则决策算法(ELECTRE TRI)结合的方法进行规则筛选,提出一种改进的Laplace度量进行规则排序,采用数据库覆盖法进行数据覆盖,获取强关联规则,从而构建一种能应用于不平衡数据的关联分析预测模型。(3)将模型应用于实际的交通事故预测中并设计实现交通事故预测系统,对预测结果进行可视化展示。本文设计并实现了一个基于上述关联规则挖掘算法和关联分析预测模型的交通事故预测系统,实现对可能发生的交通事故的实时预测功能,详细的阐述了系统总体设计及系统功能模块,对系统的实际效果进行了展示。本文提出的算法及模型都通过了各自的结果分析验证了其有效性,并将其应用于真实的交通事故预测场景中,说明提出的算法及模型能在真实应用场景下发挥其作用,具有一定的适用性。