论文部分内容阅读
股票市场在当今经济生活中受到越来越多关注,其走势受到经济、政治、文化等多种因素影响,运行规律复杂,准确把握市场规律有助于交易者获利。相对于常规价格预测,投资者更喜欢找到股价反转模式,因此对K线反转模式挖掘分析就显得尤为重要。
本文以股票历史数据为研究对象,首先针对线性分段函数无法有效划分K线序列,提出了K线区域划分算法;又发现K线模式挖掘算法计算繁杂,因此构建了基于模糊K线反转模式挖掘模型;继而发现该模型中模式分类算法泛化能力弱,挖掘结果偏差较大,提出基于局部泛化误差的径向基神经网络分类模型,并以股票历史数据进行实验验证。论文主要工作如下:
(1)针对常用时间序列分段算法均采用拟合与峰值作为序列划分标准,在K线序列中无法有效根据趋势划分K线序列,本文提出了K线序列区域分割方法,在区分收盘价上涨、下跌趋势的基础上,引入支持向量机对四种价格进行分类分割,同时根据K线序列交易特征,加入惩罚因子,调整支持向量机精确度。区域分割法识别准确率平均为69.86%,相比基于重要点的时间序列分割算法提升了31.32%,相比分段线性单点标记法提升了22.89%。
(2)目前,预测模型主要着眼于对未来价格的预测,与之相比,投资者更关心股票市场中的反转趋势。因此在K线序列区域分割的基础上,构建基于模糊K线反转模式的挖掘机制。将模糊理论应用于传统K线图理论,定义了反转模式、反转点,将K线形态特征模糊化处理,从中提取模糊特征进行模式分类。采用上证A股数据集和深证A股数据集进行验证,分别对三日与五日反转模式进行分类,准确率均超过75%,整体回报率也达到54.43%。同基于决策树的专家系统预测模型和有序模糊自回归模型相比,回报率分别提高了19.27%和20.35%。
(3)针对基于模糊K线反转模式挖掘机制中采用的传统分类算法泛化能力弱,分类效果差的问题,提出基于局部泛化误差的径向基神经网络模式分类模型(CS-RBFNN)。该模型将代价敏感模型与局部泛化误差模型结合,使其适用于K线反转模式分类挖掘。错分样本计算采用拟蒙特卡洛法逼近样本分布,然后,训练RBFNN使其获得最优结构。最后提出了差一法特征选择算法,该方法能够选择删除的特征数量,并在删除特征的同时最小化代价损失。经验证,CS-RBFNN局部泛化误差值均低于局部泛化误差模型(L-GEM)算法和改进局部泛化误差模型(L-GEM-WA)算法,CS-RBFNN泛化能力较强。同时采用上证A股训练集和深证A股训练集验证,分别对三日与五日反转模式进行分类,准确率均达到89.75%,整体回报率达到了74.45%,与模糊K线反转模式的挖掘机制相比,准确率提高了12.17%,整体回报率提高了20.01%。模糊K线反转模式挖掘机制及其改进可以为投资者提供有效决策支持。
本文以股票历史数据为研究对象,首先针对线性分段函数无法有效划分K线序列,提出了K线区域划分算法;又发现K线模式挖掘算法计算繁杂,因此构建了基于模糊K线反转模式挖掘模型;继而发现该模型中模式分类算法泛化能力弱,挖掘结果偏差较大,提出基于局部泛化误差的径向基神经网络分类模型,并以股票历史数据进行实验验证。论文主要工作如下:
(1)针对常用时间序列分段算法均采用拟合与峰值作为序列划分标准,在K线序列中无法有效根据趋势划分K线序列,本文提出了K线序列区域分割方法,在区分收盘价上涨、下跌趋势的基础上,引入支持向量机对四种价格进行分类分割,同时根据K线序列交易特征,加入惩罚因子,调整支持向量机精确度。区域分割法识别准确率平均为69.86%,相比基于重要点的时间序列分割算法提升了31.32%,相比分段线性单点标记法提升了22.89%。
(2)目前,预测模型主要着眼于对未来价格的预测,与之相比,投资者更关心股票市场中的反转趋势。因此在K线序列区域分割的基础上,构建基于模糊K线反转模式的挖掘机制。将模糊理论应用于传统K线图理论,定义了反转模式、反转点,将K线形态特征模糊化处理,从中提取模糊特征进行模式分类。采用上证A股数据集和深证A股数据集进行验证,分别对三日与五日反转模式进行分类,准确率均超过75%,整体回报率也达到54.43%。同基于决策树的专家系统预测模型和有序模糊自回归模型相比,回报率分别提高了19.27%和20.35%。
(3)针对基于模糊K线反转模式挖掘机制中采用的传统分类算法泛化能力弱,分类效果差的问题,提出基于局部泛化误差的径向基神经网络模式分类模型(CS-RBFNN)。该模型将代价敏感模型与局部泛化误差模型结合,使其适用于K线反转模式分类挖掘。错分样本计算采用拟蒙特卡洛法逼近样本分布,然后,训练RBFNN使其获得最优结构。最后提出了差一法特征选择算法,该方法能够选择删除的特征数量,并在删除特征的同时最小化代价损失。经验证,CS-RBFNN局部泛化误差值均低于局部泛化误差模型(L-GEM)算法和改进局部泛化误差模型(L-GEM-WA)算法,CS-RBFNN泛化能力较强。同时采用上证A股训练集和深证A股训练集验证,分别对三日与五日反转模式进行分类,准确率均达到89.75%,整体回报率达到了74.45%,与模糊K线反转模式的挖掘机制相比,准确率提高了12.17%,整体回报率提高了20.01%。模糊K线反转模式挖掘机制及其改进可以为投资者提供有效决策支持。