论文部分内容阅读
随着铁路信息化的发展,铁路客票营销系统积累了丰富的数据,如何以较少的人力和技术成本合理利用现有的客票数据资源获取有价值的决策信息,日趋成为铁路决策部门的迫切需求和铁路客票营销相关部门的工作重点。目前客票中心对客票营销分析的研究工作仍处于初步的数据统计阶段,这种常规的统计汇总方法很难建立有效的预测模型。基于ID3算法的客票分析方法可以建立较好的预测分析模型,但是从模型中提取的规则集合规模较大,从中提取决策者感兴趣的规则比较困难,这是客票营销分析中存在的一个的问题。 针对以上客票营销分析存在的问题,本文以铁路客运为背景,采用IFN(Information-Fuzzy Network)算法建立相应的数据分析模型,并对其进行了深入的研究和实验。IFN算法用互信息度量输入属性,从全局的角度选择较小的输入属性集合,建立比决策树更简洁准确的网络模型,此模型构造的成本低于其他分类算法,可从模型中提取维数较少的输入属性和目标属性间的关联规则。IFN算法中采用的预剪枝的方法是用似然比评估属性在统计上的显著性来判断结点是否分裂,其优点就是在计算资源受限的情况下可以随时停止模型的构造,得到的规则集合比传统算法得到的规则集合更简洁,而且也不会产生过度拟合问题。基于IFN的方法已经被很好地应用在软件测试、时间序列数据库、医学以及制造业等领域。根据IFN算法的这些特点,本文给出了其对实际客票数据进行数据分析时建立的预测分析模型,经实验验证了该方法在改善客票数据分析的综合性能、提高客票营销分析的准确性上的有效性。 研究表明,IFN算法所建立的客票营销分析的预测模型结点数较少,从模型中提取的规则集合规模适宜。相对于ID3算法建立的预测分析模型可以更有效地满足铁路客票营销分析的需求,为客票营销分析进一步的研究工作奠定了良好的基础并提供了一定的理论指导。