论文部分内容阅读
特征选择是数据挖掘和机器学习领域的重要研究部分,是从特征集合中选择相关的特征,并剔除不相关特征和冗余特征。特征选择可以有效减少问题求解中的变量,解决“维度灾难”的问题。贝叶斯网络是将概率论与图论相结合,定性和定量的描述数据仓库中变量之间关系的模型。贝叶斯网络中一个变量的马尔科夫毯包括该变量的父结点、子结点和配偶结点(子结点的父结点)。一个变量的马尔科夫毯可以屏蔽网络中其它变量对该变量的影响。本文首先介绍了马尔科夫毯学习算法的研究现状,部分算法中存在着包含错误冗余结点的问题。回归分析是确定变量之间相关关系的统计分析方法,通过假设检验,剔除与因变量相关性弱及不相关的变量。将马尔科夫毯学习算法和回归分析相结合,剔除候选马尔科夫毯中与目标变量相关性弱和不相关的变量,并利用条件独立测试返回最终的马尔科夫毯。将该方法在经典网络上的实验结果与已有的马尔科夫毯学习算法进行比较,表明了该方法的有效性和可靠性。股市的行业板块间具有很强的相关性,而房地产行业在我国经济中发挥着重要作用。利用本文算法对上证股市行业板块收盘指数数据进行处理,从股市行业板块中选择与房地产板块具有特征相关的行业板块,利用Granger因果检验从中选择与房地产板块存在时序因果关系的板块,并与房地产板块建立向量自回归模型,从而对房地产板块的日对数收益率进行预测,最后通过脉冲响应和方差分解对模型进行分析,证实了房地产板块和相关板块的影响关系。