面向股票的网络舆情信息处理与波动趋势预测

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:mavylin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票相关的舆情信息与股价波动密切相关,为了利用其来预测股价波动,需要考虑如何从股票相关的舆情信息中量化投资者的情感、如何提取新闻中的事件和如何把握情感、事件和股票之间潜在的复杂关系?因此,带着上面提到的几个问题,我们着手研究了面向股票的网络舆情信息处理与波动趋势预测,主要针对以下三方面问题:1、面向股票的网络舆情信息获取。股票相关的舆情信息分为3种:股票资讯数据(例如股票新闻、公告等)、股票行情数据(例如开盘价、收盘价等)和股票话题数据(例如帖子、博客等),其中股票资讯数据我们可以从Wind资讯金融终端获取,股票行情数据可以从TuShare (财经数据接口包)上获取,但是股票话题数据需要我们自己编写网络爬虫获取数据,因此我们设计、实现了针对东方财富股吧的分布式网络爬虫。2、近似信息去除。通过观察发现,从东方财富股吧中获取的帖子数据集和从Wind上获取的新闻数据集中都包含了很多重复或近似重复的信息。在本文的研究中,这些重复或近似重复信息的类型皆为文本,所以为了方便起见,我们将这两种信息统称为近似文本。这些近似信息的存在会对我们的研究造成干扰,因此我们提出了一种基于压缩技术的近似文本发现算法(SigNCD)。3、股票波动趋势预测。股市的运动在本质上会受到新信息的驱动,财经新闻和社会情感都会对股票市场的波动产生影响,其中我们将财经新闻中所蕴含的信息称为事件,本文研究了如何从历史股票舆情数据中提取公司事件和股民情感,并且利用张量技术建立股票波动趋势预测模型(tensor+M1+M2)。本文的研究和成果,为面向股票的网络舆情处理和波动趋势预测问题提供了很好的解决思路和解决方案,具有重要的研究价值和应用意义。
其他文献
英国二十世纪的戏剧最具活力,丰富多彩。本文试从"佳构剧"开始,对英国二十世纪戏剧文学的发展过程逐一梳理。
<正>随着工业化、城镇化如火如荼的推进,山区农村常住人口锐减,散户养殖萎缩,规模化养殖场增加,农村户用沼气使用率逐步下降已成必然趋势。山区规模畜禽养殖场的大量发展,对
由于城门洞形和马蹄形断面输水管道中的临界水深、共轭水深的计算公式和计算曲线尚缺乏现成的资料 .为工程上参考、使用的方便性 ,本文利用水流动量方程 ,分析这两种最常用的
发行后搁浅达半年之久的隆平高科,尽管姗姗来迟.还是成为本周证券市场的亮点。隆平高科连续数天良好的涨势以及40多元的高价.使隆平高科名称的授权使用人袁隆平再度陷入舆论的中
针对多指标面板数据的样品分类和历史时期划分问题,从多元统计分析理论角度提出一个多指标面板数据的融合聚类分析方法。该方法改进了多指标面板数据的因子分析和系统聚类方
我国社会经济生产和生活都离不开煤炭,随着经济发展速度的进一步提高,对能源需求的程度也在增加。而煤炭使用在带来经济效益和生活便利的同时,也因井工煤矿的开采对地表环境
江苏省徐州市农民王常兴到南京试销鸽蛋,在一小区菜市场附近出售,可是一连过了几天,销量有限。他有些丧气,觉得市场很难打开。一天,他在等候顾客的时候,看见旁边卖西瓜的,把
有些农产品,本身质量很高,营养价值也十分丰富,但由于销售手段或包装跟不上,往往卖不出好价钱,下面四种农产品增值的方法,投资不大,效益可观。
1、研究背景:杭州市作为全国医疗保险改革的先行试点地区自2001年5月施行城镇职工基本医疗保险制度以来,按照保基本、强基层、建机制的基本原则,完善政策、健全机制、加大投入
创客在2016年成为教育技术研究的热点,世界各国对于创客、创新的发展尤为重视,而创客教育也随着前沿技术的不断进步和人们教育理念的更新而迅速发展成熟,与其相关的理论研究