论文部分内容阅读
随着我国经济的发展,人们生活水平日益提高,手中剩余资金不断增多,逐渐有了投资理财意识。股票作为金融市场的最重要组成成分之一,越来越吸引人们的眼光。在股票信息数据库中积累了大量股票历史相关数据,怎样高效利用这些历史数据探寻股票涨跌的决策规则,成为人们关注的热点。近年来,金融专业人士运用基本分析、技术分析和演化分析等传统方法对股票市场进行预测,而这些方法适用于成熟的股票市场,中国股市发展的时间短,散户较多,传统的分析方法不适合中国的股票市场,所以急需一个有效的智能方法帮助人们选择合适的股票。粗糙集理论是分析和处理各种不精确、不完备信息的数学工具,它已成为数据挖掘研究的一个重要组成部分。粗糙集理论的知识获取,主要是在保持分类能力不变的前提下,通过属性约简,导出问题的决策规则。由于获取股票相关数据无法做到全面,所以应用粗糙集理论对股票数据进行挖掘比较适用。本文基于粗糙集理论,重点研究了属性约简中的基于属性重要度算法,在数据预处理阶段,先用相对性能界筛选符合要求的数据,将股票的涨跌属性定义为涨跌比率,设定阈值,满足阈值的股票数据被留下;然后用趋势增量进行离散化,将股票时间序列转换为信息系统,将一个交易日分为两个交易单元,上午和下午,分别查看上午和下午的总体涨跌情况,根据上午下午股票涨跌与股票的其他属性,如今日股票属于高开还是低开,复权价等,最终得到股票涨跌的规则。该方法解决了原有股票属性约简的不准确性问题,采用高频交易、概率制胜的方式,使得到规则的冗余属性值数目进一步降低,规则也更加满足人们的需求。在理论研究的基础上,采用matlab进行了仿真实验,通过连续属性离散化、属性约简、规则提取和规则解释四个步骤完成了基于粗糙集股票推荐的实现,通过决策规则的置信度和支持度对规则进行评价。使用真实的股票历史交易数据对基于粗糙集的股票推荐系统进行测试,取得了较为满意的结果。提供了股票涨跌的预测规则,帮助投资者选择合适的股票进行投资。