【摘 要】
:
近年来,数据科学迅猛发展,数据资源继能源、武器成为新时代国家发展的又一种重要战略资源。大数据的研究和应用层出不穷,大数据的应用已经深入到了经济社会的方方面面。我们的日常行为以数据的形式被存储到服务器,人们对数据进行加工、处理、运算,以备科学研究和业务升级。目前,数据驱动的业务模式已经深入到社会各个领域。就金融投资而言,股票的交易、政府的监管、金融市场的研究都要看具体数据,因此金融投资是离不开数据资
论文部分内容阅读
近年来,数据科学迅猛发展,数据资源继能源、武器成为新时代国家发展的又一种重要战略资源。大数据的研究和应用层出不穷,大数据的应用已经深入到了经济社会的方方面面。我们的日常行为以数据的形式被存储到服务器,人们对数据进行加工、处理、运算,以备科学研究和业务升级。目前,数据驱动的业务模式已经深入到社会各个领域。就金融投资而言,股票的交易、政府的监管、金融市场的研究都要看具体数据,因此金融投资是离不开数据资源的。证监会有专门披露数据的网站;东方财富、同花顺等专业金融机构开设了金融网站提供海内外金融数据;像搜狐、新浪这样的门户网站开设了相应的金融专区;甚至大型证券公司、上市公司也有自己的官网……如今,金融数据正在以多种多样的方式被公开、被披露。人们通过证监会、金融网站、公司官网等渠道浏览丰富的金融信息,但是不同的网站都从不同的角度表达信息,各种信息分散而且显得复杂。有时候想查找某一指标,还要阅览上市公司整年的年报,从几十页的详细报告中查找信息,费时费力,结果还有可能不够准确。通过传统方式查找信息非常不智能,因此人们提出了知识网的结构,把所有的金融信息融合成一张网。金融领域知识专业性强,各项指标相当复杂。如果能够将金融领域的信息以网状图的形式组织起来,这不仅将极大地帮助投资爱好者获得金融信息,而且还将大大提高券商分析师、交易员等人的工作效率。知识图谱的提出为金融知识网的构建提供了良好的解决方案。近年来,金融行业从业人员和科技人员致力于研发领域内的图谱。然而,金融信息专业性强和复杂度高的特性使得领域内知识图谱的构建难度很高。尽管在大量人力和财力的支持下,金融领域知识图谱的构建也没有取得突破进展,市面上的图谱都不太好用。本课题专注于股票交易方面,研究了股票交易关注的技术指标;研究了上市公司的股价和年报信息;研究了爬虫的方法;研究了从金融网站获取数据中抽取上市公司信息实体及属性的方法;研究了形成上市公司信息知识三元组的方法;对上市公司知识图谱的构建进行了研究并实现;深入研究学习图数据库,比较了关系型数据库和图数据库的性能和使用方法;研究了Django框架的使用方法,利用该框架拓展知识图谱的智能应用;研究了循环神经网络算法,利用该算法训练股吧问题集;尝试根据上市公司知识图谱进行智能问答系统的构建,设计并实现了基于模板匹配的知识图谱智能问答系统。该方法从股吧真实问答集中挖掘问答模板,获取问句意图、实体槽位等信息。对于提出的新问题,通过循环神经网络算法找到匹配的模板,进而得到用户的实体、意图,将意图和实体值作为对应Cypher查询语句的参数,然后从知识图谱中抽取答案,并根据回答模板给予自然语言的回答。
其他文献
拓扑材料的探索和拓扑物性的研究是当前凝聚态物理领域中的一个重要研究课题,而第一性原理计算方法是研究材料拓扑性质的最直接工具。在本文的绪论中,我们介绍了密度泛函理论,其核心是从Hohenberg-Kohn定理出发,导出单电子薛定谔方程——Kohn-Sham方程,这是第一性原理计算方法最坚实的理论基础。对称性在物理研究的各个领域都发挥着至关重要的作用,群论作为抽象归纳出来的数学工具,可以大大简化物理问
燃料电池是一种将燃料的化学能通过电化学反应直接转化为电能的新型能源装置。在各种类型的燃料电池中,质子交换膜燃料电池和阴离子交换膜燃料电池均是使用固体聚合物作为膜电解质。离子导体膜作为燃料电池的关键部件,其性能将直接影响燃料电池的能效。目前,制约聚合物电解质材料进一步发展的关键问题是,膜具有高电导率的同时往往会伴随着过度的溶胀和机械强度的下降。在增强离子导体膜的尺寸稳定性和机械强度的方法中,制备有机
台风是一种伴随着狂暴雨的具有危害性的极端天气系统,常给登陆地区造成巨大的经济损失,甚至威胁人民的生命安全。我国濒临全球最大的台风源地——西北太平洋,是受台风危害最严重的国家之一。台风有时会连续发生,对社会产生更大的危害。目前关于台风群发还没有明确的统一的定义,其发生机制也还没有研究清楚。因此,西北太平洋台风群发性是值得研究的问题。本文利用1945-2018年美国联合台风警报中心JTWC台风最佳路径
开关电源由于其高效、体积小等优点广泛应用于各行各业,本文针对消费类电子、汽车电子和LED驱动等领域,设计了一款高效率、宽输入输出范围的同步峰值电流模boost型DC-DC变换器。本文围绕电流模boost变换器的系统设计和相关电路设计展开工作。传统的峰值电流模boost建模过程太繁琐,且计算量大,本文使用了一种较简单的建模方法,得到了与传统模型类似的表达式。为了满足宽输入输出范围的特点,本文使用MA
自由基反应具有反应条件温和、官能团兼容性良好等优点,因而在有机合成领域具有重要地位。随着能源问题日益严峻,利用绿色可再生的光能发展的无污染有机合成化学逐渐引起化学家们的重视。并且随着配位化学发展出了一系列在可见光区具有很强吸收带的有机金属配合物作为光敏剂逐渐应用于有机合成,光催化的有机合成化学在近十年飞速发展。光催化的自由基反应在构筑各类有机碳氮骨架上具有重要应用,其中构筑功能化的含氮杂环和在药物
拓扑半金属是一种新奇的物质态,具有奇异的无能隙激发,低能情况下受相对论量子力学控制。随着对这些奇异的拓扑相研究兴趣的不断增长,预测或显示具有拓扑特征的材料数量正在不断增加。Weyl半金属作为三维情况下的特殊的拓扑半金属,特征是成对出现的具有不同手性的线性能带交叉以及奇特的费米弧表面态。不仅Weyl半金属的拓扑性质而且Weyl半金属可能存在的超导配对机制吸引了大量的研究。对于具有空间反演对称性的We
近十年来,无人机技术不断进步,在各个领域都得到了广泛的应用。为了进一步提高无人机执行任务时的效率,人们开始研究如何使用无人机集群替代单个无人机。一种典型的应用场景是:使用无人机集群对大型仓库中的货物进行盘点。为了能够安全、高效地执行库存盘点的任务,必须对集群中的无人机进行精确的定位。传统的无人机室内定位方案中,基于计算机视觉的方案只能在光照良好、环境纹理丰富的环境中运行,基于无线信号的方案通常仅适
随着工业化进程的不断加快,运载车已经成为人类生产生活不可或缺的重要交通工具。在运载车的众多性能之中,安全性能无疑是最为重要的。而衡量运载车安全性能的一个重要指标就是制动性能。制动系统一旦发生故障,很容易导致交通事故的发生,对人们的生命和财产造成极大的损失。而且数据表明,大量交通事故的发生都与制动系统的故障有关。有鉴于此,对运载车制动系统的失效分析便具有重要的现实意义。本文通过断口宏观分析、金相组织
航天事业是一个国家综合国力的重要标志,航天事业的发展为我国提升科技和国防实力的提升做出了巨大贡献。回顾我国航天事业之所以能够取得如此成功,除了国家的大力支持以及老一辈航天人的努力外,由钱学森提出的航天总体设计部思想起到了至关重要的作用。随着我国市场经济体制改革和军队装备竞争性采购改革的深入发展,航天企业,尤其是航天总体设计部面临的内外部形势前所未有的复杂。对于长久以来“不顾一切代价追求成功”的航天
能源的日益枯竭和社会对环保要求的提高,迫使汽车必须减轻自身重量来达到节能减排的目的。越来越多不同类型的材料被汽车行业的研究人员应用于实现汽车的轻量化,其中铝合金因其密度小、强度高、耐腐蚀性好和成本相对较低等优点备受各大汽车制造商的推崇,已经成为汽车轻量化材料的首选,不同车型结构件的铝合金应用率逐渐升高。由于铝合金与传统用钢板的晶体结构差异明显,适用于钢板的冲压成形数值模拟理论和工艺参数无法直接套用