基于机器学习的证券数据趋势特征提取研究

来源 :成都信息工程大学 | 被引量 : 0次 | 上传用户:hntkpop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
证券数据是一种时间序列,具有高度的复杂性和不确定性,通常只有极少数交易者能掌握证券数据趋势特征。机器学习通过对证券历史数据的学习和自动优化算法,可模拟或实现人类的思维模式获取数据信息或特征,因此是对证券数据趋势特征分析的有效技术。本文采用卷积神经网络和长短期记忆网络这两种机器学习模型,以及分类和回归两种分析方法来提取证券历史数据中的趋势特征,包括:趋势分类、趋势强度和趋势续航力。主要研究内容有:(1)获取并预处理证券历史数据。本文采用的证券历史数据包含日线证券历史交易数据和日线大盘指数数据,其都是从新浪财经网站爬取而来,然后将日线数据进行预处理,包括了数据补齐,日线数据合并为周线数据、每日周线数据等。最后计算证券数据的技术指标,包含了均线、平滑异同平均线等。(2)标记历史数据标签。本文采用监督学习,需要在训练过程中输入期望的结果值。本文根据平滑异同平均线技术指标,标记了每日周线数据的三种趋势特征,作为训练中期望得到的结果值。(3)进行机器学习模型训练。本文分别采用卷积神经网络和长短期记忆网络为基础,构建了两种机器学习模型。这两种模型均用sigmoid函数或者softmax函数分类得出趋势分类;线性回归函数拟合趋势强度和趋势续航力;以交叉熵或者最小均方误差为其目标方程;以自适应学习率算法为其优化函数。训练结果表明,机器学习模型的最终损失值成功收敛,说明模型的学习过程有效。(4)回溯测试。通过比较模型的输出值与实际值的准确率或者误差值,来评价本文所采用机器学习模型对于趋势特征的提取效果。回测结果表明,本文提出的学习模型取得约70%的分类准确率,分类效果良好;趋势强度相对误差值在50%以内;趋势续航力相对误差值大多数高于50%。最后,通过回测结果的比较和分析,还给出本文最优的机器学习模型结构。本文提出的基于机器学习的证券数据趋势特征提取模型,通过学习具备了趋势特征提取能力,本文最后回测结果表明该模型的有效性。
其他文献
基于资源的理论表明组织胜任力对企业获得竞争优势具有重要意义。本文在分析个体胜任力和组织胜任力的特点及两者间关系的基础上 ,从开发个体胜任力的角度 ,探讨了提升组织胜
本文以重庆轨道交通十号线天宫殿至民心佳园地铁隧道为例,通过模拟计算、工程对比等方法确定穿越回填区地铁隧道的结构断面、支护措施及施工步序。旨在对地铁隧道穿越回填区的
研究了Al-Cu-Li-(0.35Mg)-(0.2In)合金的拉伸性能、时效析出相类型及其分布。T6峰时效时,Al-Cu-Li合金的时效析出相为T1(Al2CuL i)和θ’(Al2Cu)相。添加0.2%In时,T6态时效早期形成许
信息类课程使用虚拟实验具有方便性、低成本、开放性、深入性等优点,但因为其受众具有较好软件和数学基础的特点,使得实验设计具有很大特异性和难度。从项目选择、描述层次、结
在pH8.2的三乙醇胺缓冲溶液中,有OP存在下,铀(Ⅵ)与2-(5-溴-2-吡啶偶氮)-5-二乙氨基苯酚(5-Br-PADAP)生成红色络合物,其最大吸收波长为535nm,表观摩尔吸光系数1.0×105L·m
蒲山大桥为主跨225 m系杆拱桥,主桥采用刚性系杆钢管混凝土桁架拱结构,横向设置3片拱肋,桥面系对应设置3道纵系梁,系梁采用预应力混凝土箱形结构。系梁采用预制法施工,采用大
<正>传统灌输模式的失败20世纪后半叶到70年代,人们对已经进行了长达几个世纪的科学技术传播活动进行了思考。一般认为,人们一直采用的是线性模式进行传播活动的。线性模式认
2017年,全国税务系统组织税收收入12.6万亿元,同比增长8.7%,实现了税收与经济增长的协调性发展,在经济下行压力大、组织税收困难多的同时,各级税务部门、尤其是基层国税局,在
职业生涯规划理论起源于西方,浙江海洋学院针对学生的特点,结合浙江省海洋经济发展的特色,探索了舟山地区涉海类职业生涯规划课程本土化的教学方式、教学目标和教学效果评估
在山东省招远市水旺庄3000 m金矿深部科学钻探项目ZK3401孔的施工过程中,通过精细管理,统筹深孔钻探技术、后勤保障、设备机具等工作基础,进行施工方案可行性论证,提出科学可