论文部分内容阅读
证券市场是市场经济发展中必不可少的重要组成部分,是公司筹集资本、投资的重要场所,证券市场的稳定与否、发展程度影响着中国经济的发展,其作用在市场经济、宏观调控中不容忽视,所以被称为国民经济的“晴雨表”。但是,证券市场是一个复杂的、动态的经济系统,受到宏观经济、政策、行业发展、投资者心理等诸多因素的影响,使证券投资没有规律可循。随着中国经济的发展,证券市场不断发展完善,证券投资已经成了一种重要的投资方式,影响着国人的生活。但是证券市场变幻莫测,只有极少数投资者才能获得超额收益,所以如何准确的分析预测证券市场的趋势,如何获得丰厚收益并长期立于不败之地,是每个投资者所关心的。证券市场不断发展完善,逐渐形成了基本面分析、技术分析、投资组合分析等理论,同时随着计算机技术的不断发展,处理能力和储存能力的不断提高,证券市场中积累了越来越多的数据,经典分析方法已经不能很好的解决“数据灾难,信息匮乏”的矛盾。数据挖掘以海量数据为分析对象,在大量的、没规律的数据中寻找隐藏的、有规律的、有用的信息。由于数据挖掘技术有很强的非线性处理功能、强容错能力等优点,所以得到了快速的发展。目前已在银行、电信、零售、保险、证券等领域有广泛应用。在证券市场中的应用主要集中在客户分析、客户关系管理、市场预测、公司基本面分析、风险管理等方面;使用多种数据挖掘方法,主要有聚类、关联规则、分类、决策树、神经网络、时间序列等方法。本文用数据挖掘技术从基本面、技术面对证券市场进行分析。首先用决策树对基本面进行分析,选取2008年所有上市公司为研究对象,选取每股净资产、每股现金流量、净资产收益率、营业收入增长率、净利润增长率、每股收益6个财务指标,对上市公司进行分析,利用每股收益作为分类指标对公司分类,并利用分类模型对每股收益预测分析,取得较高的准确率。文中通过关联规则分析,挖掘出股票板块之间,区域之间存在较强的相关性。属于相同行业,经营、生产相同或者相近产品的公司往往具有同涨同跌的趋势;处于同一区域的股票由于受到国家政策或区域经济发展的影响,往往存在较强的相关性。更重要的是关联规则可以发现属于不同行业、不同区域,看似不相关的股票之间的强相关性。本文以沪深300指数成分股为研究对象,利用关联规则挖掘出股票之间的相互关系,通过关联规则发现形如“在同一天时间里,股票A上涨,则股票B也上涨”,“在同一天时间里,股票A上涨,且股票B上涨,则股票C也上涨”等规律。用关联规则对股票进行预测。当行业之间存在相关性,但是公司的涨跌时间存在先后顺序,在实际投资中,可以把这些先涨的股票作为一个风向标,通过观察敏感的股票,进而投资于后涨的股票。文中利用沪深300指数成分股发现形如:“股票A和股票B在t1同时上涨,则股票C在t1+1时间上涨”的规则,这样的规律在股票投资预测中有很大的指导作用。