微博内容挖掘与金融时间序列关联性研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:liongliong562
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,社交媒体正日渐成为人们生活不可或缺的一部分。社交媒体为广大用户提供了一个即时的分享平台,用户可以通过文本、图片、音视频等方式在平台上分享消息,而平台的社交属性又使得这些消息可以沿着关注链呈指数级的传播。除了作为网民提供信息的重要平台,社交媒体也已经逐步成为网民获取信息的重要渠道。而伴随着移动互联网的兴起,微博凭借其面向移动用户的特点,得到了更加迅猛的发展。在全球范围内,80%的网民都在使用社交网络。中国互联网络信息中心报告显示,截止到2015年6月,中国网民达到了 6.68亿,其中,社交网络的使用率超过7成,而微博使用率则超过30%。2015年第三季度,微博的月活跃用户数已经超过2亿人,成为了中国最重要的社交媒体。微博的蓬勃发展带来了大量的内容信息,对于这些由用户生成内容进行挖掘,具有十分重要的意义。微博内容具备巨大的挖掘价值,这些信息一方面体现了用户对于自身生活状态、生活环境的态度,另一方面也包含了用户对于关乎国计民生的大事的意见和声音。通过对于微博的挖掘,提取出公众对于金融领域和事件的态度和情绪,厘清公众微博挖掘内容和金融问题的关系,对于个人和机构的投资决策,以及管理机构的政策制定都有重要的意义。对于微博平台的挖掘,一方面可以针对用户产生的内容进行挖掘,提取出用户在发布内容时传递出的潜在信息,另一方面,可以针对信息在传播过程中体现出来的用户关注关系网络进行挖掘。本论文基于上述思路,分别对微博进行了情感分析和图论分析,挖掘出微博文本和结构中包含的信息。为了将微博挖掘结果应用于金融领域,本论文设计了 一种基于金融主题模型的关联算法,在微博与金融实体之间建立对应关系。依据对应关系,将微博挖掘结果与对应的金融时间序列进行关联性分析。根据关联性分析的结果,利用微博挖掘结果对金融时间序列进行分析和预测,并通过基于预测结果,实现自动交易策略,验证了微博内容挖掘结果对于金融时间序列预测的效果。
其他文献
为了解西安市暑期少儿游泳培训现状,归纳培训中存在的问题,最终提出对策。本文运用文献资料法、实地调查法和专家访谈法对西安市少儿游泳培训机构进行实地调查。通过调查发现
采用气相色谱和质谱法对柬埔寨南部地区的南亚松松香和松节油的化学组成特征进行研究。采用水蒸气蒸馏法将南亚松松脂分成松节油和松香两个馏分后,分别对松香和松节油中所含成
中国农村五保供养制度是中国社会救助制度的重要组成部分。农村五保供养制度的供给对象通常被称为"五保户",五保老人是五保户的重要组成部分。自中国农村五保供养制度实施以
目的:观察益气健脾中药汤剂治疗乳腺癌患者癌因性疲劳的临床疗效。方法:应用随机平行对照方法,将75例符合癌因性疲劳诊断的乳腺癌患者,随机分为两组。对照组37例患者使用常规
军队思想政治教育主体性是由教育者、受教育者、教育决策者、教育活动等多极主体共同构成的。对军队思想政治教育主体性的认识,要走出只看到教育者的主体性或者只承认受教育
目的:比较生理盐水和肝素钠用于静脉留置针封管的效果。方法:240例采用常规静脉留置针输液的患者,随机分为观察和对照组各120例,观察组用生理盐水封管,对照组用肝素钠稀释液
机场端近净空区是机场障碍物限制最严格的部分,也是关系到机场运行安全的关键。针对现行机场净空规定中端净空区是综合各种机型的相关数据,以最不利状态确定的限制高度的状况
<正>现状1:从高考数学试卷的变化趋势来看,题目对学生的阅读能力和转化问题的能力的要求正在逐步提高,要求学生能对已给的条件和信息进行加工处理和整合.但是相当一部分学生
主要采用文献资料法先从整体上论述了脂代谢的影响因素,进而从耐力运动对脂肪氧化、血脂和脂蛋白的影响这两个方面的研究现状入手,深入系统地阐述了耐力运动对脂代谢的影响及