基于机器学习技术的比特币价格时间序列研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:kccsong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2008年,中本聪提出了比特币的概念,经过一段时间的发展,根据其概念应运而生的开源软件、对于比特币架构及其核心算法的研究形成了比特币的生态环境。
  由于比特币早期具有易流通、交易成本低、易挖矿、去中心化的特点,比特币在早期发展速度很快。但是由于比特币体系匿名性的特点,这一点被不法分子利用用作金融犯罪活动,各国政府一度对比特币交易进行严格的管控,导致比特币价格出现了不稳定的情况。
  经过这几年起起伏伏的发展,比特币慢慢被广大投资者所接受,比特币市场也逐渐稳定起来,外部政策因素对于比特币市场的影响逐渐变小。所以研究经济因素以及比特币内部因素对于比特币价格形成的影响也就有了现实意义。
  比特币由于其将加密技术与货币单位相结合的固有特性,在经济学、密码学以及计算机科学领域都有相当的研究价值。近年来,人们对比特币价格的时间序列作为一个具有特定技术规则的新市场变量进行了大量的建模研究。
  在现有的研究当中,主要是在研究市场力量、投资者吸引力和全球宏观金融因素等几个因素对于比特币价格形成的影响。但是比特币的核心技术是区块链的形成,是比特币有别于其他金融产品的关键所在,直接关系到比特币的供求关系。根据现有的研究,除了宏观经济因素以外,区块链信息和区块链网络信息还很少被系统的用来研究以及描述比特币价格形成的过程。
  针对上述问题,本文拟采用区块链信息、区块链网络信息、全球货币市场指标以及宏观经济因素对比特币价格序列进行建模和预测,对比特币价格序列进行了系统的评估和表征。
  本文在已有的研究基础上采集了近三年以来包括比特币网络区块传播延迟、哈希率、比特币挖矿难度、美国道琼斯指数、美元对欧元汇率在内的26个维度的数据,涵盖了宏观经济因素、全球货币市场指标、区块链信息以及区块链网络信息。
  本文首先使用线性回归模型对比特币价格形成进行线性分析,通过实验分析并排除了具有多重共线性特征的特征属性以后,使用岭回归模型进行建模,将其作为实验的对照组,分析各类特征向量与比特币价格的线性相关性。而后对预测结果进行残差分析,证明了线性回归模型的有效性。
  然后分别对排除多重共线性后的变量集合以及未排除多重共线性的变量集合进行长短时记忆神经网络模型建模,选取不同的时间步长进行分析。通过组合步长与变量集合形成了20个数据集,分别进行了对比实验。实验后发现,选取时间步长为4和未排除多重共线性的变量集合所形成的数据集进行建模的建模效果最佳。实验证明了比特币未来的价格形成是可以由模型通过学习历史的数据来进行预估和分析的,且选取研究时间点前四天的数据进行分析,效果最佳。同时通过实验的对比,选取未排除多重共线性的数据集进行建模训练比选取排除了多重共线性的数据集进行实验,实验效果有明显的提升,这也从侧面证明了长短时记忆神经网络模型能够有效的学习到数据中的非线性信息,该模型的非线性拟合能力比较强大。
  最后,通过长短时记忆神经网络模型实验的结果,选取时间步长为1和未排除多重共线性的变量集合所构成的数据集进行贝叶斯神经网络建模。实验发现,贝叶斯神经网络模型对于比特币价格序列具有良好的解释性,它对比特币价格以及价格的波动性均有良好的预测性能。贝叶斯神经网络可以通过对参数后验分布的分析对估计和预测的不确定性进行评估。本文最后选取贝叶斯参数后验采样的均值,利用Garson教授[1]提出的基于神经网络连接权的变量敏感性分析方法,研究并计算了神经网络输入变量对于神经网络输出的影响程度。实验结果表明,区块链信息是影响比特币价格形成最为关键的因素,宏观经济指标和全球货币市场指标次之。在区块链信息方面,比特币的总交易费用是对比特币价格形成影响最大的因素,比特币的交易量次之。此外,美元对欧元的汇率、哈希率、挖矿难度以及区块传播延迟等因素均对比特币价格形成有不同程度的影响,其余的特征属性对比特币价格形成影响较小。
其他文献
文字是人类交流信息的工具,是简单的视觉图案再现口语所表达的形式。随着深度学习技术的不断发展,自然场景文本检测技术已经成为计算机视觉与模型识别等领域的重要研究课题之一。本文针对自然场景下的文本检测问题进行了研究,不同于传统的光学字符识别技术所识别的文本图片,自然场景图像中的文本在外观上,具有字符大小不统一、文本方向不确定、背景复杂等特点,使得检测难度较大,也为后续的识别过程带来不必要的麻烦。针对自然
学位
随着大数据时代的来临,越来越多的应用程序应运而生。为了提升用户的使用体验,增大用户黏性,个性化推荐算法成了各大应用程序寸土必争的领域。目前主流的个性化推荐算法大部分是通过用户以往对于产品的评分来研究用户的喜好,进而向用户提供推荐列表。然而,目前面临的难题是网络上用户评分过于集中,评分可信度不高,导致推荐算法的推荐准确率并不理想。  网络信息越来越丰富,能体现用户情感的信息也越来越多,除了用户的评分
传统金融行业中各类型数据丰富,蕴藏着巨大价值,如何有效地使用这些数据并从中提取有用信息,帮助用户进行决策,是目前金融业内人士面临的一大问题。而构建金融领域的知识图谱可作为该领域语义理解及搜索的关键技术,为以后金融领域的文本分析、数据挖掘、决策推理等提供有力支撑。  知识图谱是2012年Google公司提出的一个新概念,是一种用图模型来描述知识和建模世界万物之间的联系的技术方法。知识图谱由节点和边组
学位
图像超分辨重建是计算机视觉研究一个重要的方向,在现实生活中可以应用在许多领域。在实际工作或者日常生活中因为设备成本、技术限制、网络限制等因素常常不能得到足够清晰的图像。如果单纯的依靠提升硬件设备不仅成本耗费非常大,而且有些情况下会难以实施,比如人体医学成像中会受到人体组织的干扰。因此,对图像的超分辨处理在某些时候就显得尤为重要。图像超分辨重建的技术已经应用在很多领域,如医学成像、遥感成像及监控视频
在大数据时代,“信息过载”是困扰用户快速有效的从互联网获取有价值信息的主要问题。推荐系统作为解决这一问题的有效方法,已经成为学术界和工业界的关注热点并且得到了广泛的应用。然而,由于数据规模以及数据多样性的与日俱增,传统的推荐算法已经达到了性能瓶颈,同时,随着深度学习技术在图像、视频、语音等领域的广泛应用,基于深度学习的推荐算法目前成为研究热点。因此,本文提出了基于图卷积神经网络的推荐算法模型,并利
学位
随着人工智能技术的不断发展,知识图谱(Knowledge Graph)已成为结构化知识驱动智能应用的核心数据支撑。知识图谱本质是一种语义网络(Semantic Web),其节点代表实体(Entity)或者概念(Concept),边代表实体或概念之间的语义关系(Relationship)。知识图谱包含大量结构化知识,形如三元组:,例如:;二元组:,例如:。知识图谱帮助机器理解知识语义信息,广泛应用在
学位
当今世界,任何一个国家都无法独立发展,各种文化之间的相互影响和渗透越来越大,甚至促进了人类社会的进步。因此,不同语言之间的翻译已成为各国经济、政治和文化交流过程中的关键点。随着全球化的不断深入,各类翻译活动更是如火如荼的开展起来。人们现在不仅需要高效快速的翻译,对翻译质量的要求也是越来越高,这就需要对翻译质量进行评价。过去对翻译质量的评价主要靠人工进行,主观性较强,没有确定的译文质量评价标准,并且
学位
传统金融学和现代行为金融学都认为股票市场的波动受到信息发布、传播、公众接受的影响。早期的股价预测研究主要是对股票历史交易数据进行分析处理,从中挖掘对股价走势判断有利的特征,随着人工智能、自然语言处理技术等技术的发展,从新闻媒体中提取能够反映宏观经济、基本面以及影响投资者情绪的信息变为可能,研究者开始将新闻文本数据与股票交易数据结合对股价进行预测。  利用新闻进行股价预测的关键之一是准确提取新闻中包
学位
在经济全球化的背景下,企业与企业之间逐渐建立了密不可分的关系。企业不仅仅会受到企业本身发展的直接影响,还会受到其合作伙伴支持和竞争对手的限制。在一家企业的全球化进程中,单兵作战往往会发展成为多家合作、交叉控股从而减少风险。对一家企业的评估不能只停留在企业本身的资产负债表和利润表,还要对与该企业相关联的公司进行风险评估。例如2016年乐视发生信用风险,一家大公司突然没落影响了多家相关企业和个人发生信
学位
现实世界中的网络往往并非是孤立运行的,不同的网络之间会存在着千丝万缕的关联,例如物理依附、逻辑依赖、能源或信息交换等,互相依赖、协同工作的网络情况更是现代社会普遍的现象。现实告诉我们,各类互相关联的网络共同服务于我们,能够大幅提高工作效率,缩短工作时间,但是与之对应的,所有网络之间都相互关联也存在着不小的风险。  近年来,不少学者根据现实世界的网络情况,抽象模拟出了多种具备不同特殊性质的网络模型,
学位