【摘 要】
:
基于机构研报及其持股周期性的行为预测研究属于比较新兴的研究领域。本文基于随机森林和自然语言分析构建机构行为预测系统。研报研究的要点为自然语言理解,以及诸多交叉学
论文部分内容阅读
基于机构研报及其持股周期性的行为预测研究属于比较新兴的研究领域。本文基于随机森林和自然语言分析构建机构行为预测系统。研报研究的要点为自然语言理解,以及诸多交叉学科。自然语言处理的核心是对文本特征的研究,其主要包括分词和文本分类。由于CoreNLP具有强大的语法解析功能,随机森林具有良好的精准性和鲁棒性,它们能为本文预测模型的实现提供很好的基础,所以本文通过使用CoreNLP分词工具对研报进行分词以及随机森林分类器对机构研报进行分类。本文的预测模型在通过大量的研报数据训练和验证后,准确率可达72%。本文所研究内容可为基于机器学习方法的金融研报数据分析提供有力的支持。
其他文献
知识教育中存在科学文化知识与经典文化知识的冲突。从文化传统关于知识的预设来看,这种冲突源于关于科学文化知识的教育和关于经典文化知识的教育各有其思维方式预设,完善或
本研究关注于地铁站外导向标识的布点问题,提出了一套使导向标识利用率最大化的布点优化方法.首先,根据导向标识不同的功能定位,对其进行分类;其次,在确定地铁站点服务范围的
杨少林,工程师,毕业于江西中医学院药学系,获学士学位,1999~2003年清华大学远程教育学院企业管理专业学习。现任广东养宝生物制药有限公司董事长、总经理。近年来主持佛山市、
农村职业中学的学生文化基础相对较差,学习英语的兴趣不高,如何端正学习态度,形成正确的长远的学习动机,提高学习英语的热情和自觉性,已成为亟待解决的一个问题。如何让学生树立“
孟良崮战役,是在国民党军对山东地区实施重点进攻时,我华东野战军于1947年5月13日至16日在山东蒙阴地区进行的一次成功的山地运动歼灭战。这次战役,我军遵照毛泽东“诱敌深入”
本文运用文本分析的方法对纪录片《草原:我们的故事》进行分析,主要从片子的叙事主题、叙事结构、叙事语言三方面分析,从叙事的内容挖掘片子表达的主题,平民化的视角下揭示出
培养学生的自主学习能力是外语教学的目标。网络环境下的大学英语自主学习打破了英语学习时间和地点的限制,体现了学习者的主体地位,并以其个性化的学习方式满足了不同层次学
随着社会的不断发展,网络应用的逐渐普及,互联网已经渐渐深入到我们生活中的每个角落,也因此给我们的生活及学习带来了不可忽视的影响。在网络技术发展的过程中,电子商务活动
政治思想工作是企业凝聚人心的重要抓手,文化是企业的灵魂所在,加强基层职工政治思想工作在国有企业发展中显得尤为重要。目前在国企一线班组中的政治思想工作还存在着许多的
提出了一个含崩塌概率的一维沙堆模型,并用元胞自动机方法对该模型进行计算机模拟。结果表明在崩塌概率 p 从0到1的变化过程中存在两个临界点 p1和 p2。当 p1<p<p2时模型具有自