基于强化学习的区块链自私挖矿策略

来源 :深圳大学 | 被引量 : 0次 | 上传用户:dysongbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从于2008年问世以来,比特币就作为首个实现完全去中心化的数字加密货币而受到极大的关注。在比特币网络中,所有用户的交易信息都会被记录到一种称作区块链的公开数据结构中。区块链的安全性主要依赖于维护其正常运作的分布式协议,这些协议由区块链网络中被称为矿工的用户执行。传统的观点认为,区块链网络中的挖矿协议是激励相容的,同时能够在分布式系统中抵御小部分作恶的节点。最初,在基于工作量证明的区块链系统中,人们相信协议中规定的诚实挖矿就是能使矿工的收益最高的区块链挖矿策略。但是之后的研究表明,使用诚实挖矿以外的策略有可能获得更高的区块链挖矿收益。实践中可以将区块链挖矿任务建模为马尔可夫决策过程(MDP),然后对其求解得到收益最高的最优挖矿策略。然而,求解区块链挖矿的MDP模型需要事先知道表征该区块链网络的各种参数值。在实际的区块链网络中,这些参数值往往难以获取,并且会随着时间而发生变化,这阻碍了对区块链挖矿MDP模型进行基于模型的求解。本文将机器学习领域的强化学习理论,应用到区块链挖矿的任务中,通过智能体与区块链网络的交互,可以动态地学习到性能接近最优挖矿策略的强化学习挖矿策略。因为区块链挖矿MDP模型中具有一个非线性的目标函数(标准的MDP模型中为线性的目标函数),所以在本文中设计了一种新的多维强化学习算法用于求解。实验结果表明,在区块链挖矿MDP模型的参数值未知的情况下,多维强化学习挖矿算法能够通过与环境的交互学习到最优的挖矿策略,而且在变化的网络环境中仍然能达到最优性能。同时,本文还对区块链挖矿MDP模型进行拓展,使其能够表征更多现实区块链网络中的影响因素,并基于拓展后的MDP模型设计了一种新的定量分析框架,用于分析基于工作量证明的区块链网络中各种共识与网络参数对其安全性能的影响。本文还根据拓展后的MDP模型,提出了考虑到各种现实约束的强化学习挖矿策略,这些约束包括不同的区块体积、区块间隔、消息传播机制以及日蚀攻击的影响。最后通过仿真实验的方式,研究了在基于工作量证明的区块链网络中这些参数对于强化学习挖矿策略的影响。
其他文献
资源枯竭和环境污染是当今世界上的两项巨大挑战。建筑作为人类主要的居住环境,是能源消耗和污染排放的主要贡献者之一,建筑业必须成为节能减排的重点,同时应承担为人类提供舒适健康的使用空间以及良好生态效益的任务。中国是目前世界上最大的排放国和最大的能源消费国,为解决这两个问题,促进绿色建筑的发展势在必行。绿色建筑可以在建筑的使用周期内尽可能最大化的实现节约资源、保护环境的目标,并且为人们提供健康舒适的使用
近年来,随着时代的发展,各地高校数量的增多,可持续校园的理念被运用于校园规划与建设中。步行作为最“绿色”的出行方式,得到校园可持续规划的重视。在新校园的交通系统规划设计中,逐渐体现出“人车分离”和“步行者优先”的设计原则。但在多数已建成的大学校园中,由于在规划设计之初对步行系统的重视不够,校内的步行空间存在着一些亟待解决的问题。针对这些问题,需要通过有针对性的优化设计,创造更加便捷、舒适的步行空间
移动边缘计算(Mobile Edge Computing,MEC)是一种新兴的计算范式,它在智能物流、城市智能交通和智能安防等方面都有着广泛的应用前景。在这些场景中,卷积神经网络(Convolutional Neural Network,CNN)是一种常用的技术。它在图像识别、物体检测等领域有着出色的表现。在过去,卷积神经网络的训练和推理都在云端完成。随着片上系统(System-on-Chip,S
随着世界各国军事现代化建设步伐加快,军队信息化程度越来越高,信息化战争已是大势所趋。为了适应快速变化的信息化战场局势,由本地指挥中心和各种战术终端组成的战术边缘网络应运而生。凭借自身高机动性以及强大的战场态势感知能力,战术边缘网络在信息化战争中扮演着越来越重要的角色。然而,在敌我双方对抗的环境下,敌方会通过各种手段攻击我方战术网络,特别是对于靠近战场前线的战术边缘网络,受敌方攻击和篡改的可能性更大
第五代移动通信技术(5th generation wireless systems,5G)在信道容量、时延、吞吐量等方面有明显的改善,其数据传输速率可达4G的数百倍。随着5G技术的飞速发展,5G的应用将渗透到各行各业,促进全球数字化转型。目前5G频谱在移动终端的商用主要集中在sub-6 GHz频段,毫米波频段的应用尚未成熟。由于5G高传输速率的要求以及手机终端尺寸的限制,5G终端天线必须要具备宽带
现如今,电子设备各式各样,有很多的因素决定着电子设备的性能。这其中,时钟源是一个比较关键的因素。时钟源就好像电子设备的心脏,电子设备要想正常运行,时钟源不可或缺。随着通信设备的普及,通信测量仪器的需求量也日益增多,现代通信设备测量仪器中,需要精准的时钟源,来保证测量数据的精确性。所以,精准的时钟源有着广阔的应用前景。但是,在使用时钟源的过程中,其输出频率会随着温度的变化而恶化。所以,对时钟源进行校
复杂系统在自然社会中无处不在,而网络科学是描述、分析、理解、设计复杂系统最常用的理论框架。网络科学的研究内容十分广泛且丰富,学习节点属性对网络连边进行预测是当下热门的研究内容之一,其中链路预测和推荐算法的研究都是根据节点相似性对网络未来可能产生的连边进行预测。链接预测是网络科学中重要的研究方向之一,具有巨大的研究和实际应用价值。近年来,网络表示学习的方法通过学习节点特征,使得链路预测的研究取得了重
近年来,推荐系统发展迅速,在诸如淘宝、京东、亚马逊等各大电商平台上随处可见,它在一定程度上给商家带来了可观的经济收益,同时也帮助用户更好地选择商品。传统推荐算法主要研究用户与物品之间的关系,然后给用户推荐最符合他们兴趣爱好的物品集。但在现实生活中,用户的历史行为隐含着某些辅助信息,例如相邻物品间的关系等信息。比如一个Java开发工程师,随着工作时间的增加,其阅读的书籍逐渐由入门类书籍过渡到更加专业
现今互联网中的数据大多呈现出规模庞大、结构松散的特点,使得人们从中获取有用的知识信息变得异常困难。知识图谱补全(KGC)技术是扩充知识图谱规模的关键技术之一,目前主要方法是基于已有的结构化信息以及无监督的学习方式对知识图谱进行补全。本文以知识图谱为研究对象,提出语义关联信息抽取模型,并在该模型基础之上衍生出两种开放式的动态知识图谱补全模型,工作主要包括以下三部分:(1)针对现有的知识图谱补全模型大
如今,随着电子商务、社交网络和人工智能等技术的不断发展,信息量每天都在快速增加。面对海量数据,我们时常因为不知如何获取有价值的信息而倍感焦虑。智能推荐算法能帮助我们缩小选择范围,快速从海量数据中筛选出我们可能感兴趣的信息和物品。在众多推荐算法中,基于协同过滤的推荐算法是其中一类较为有效的算法,而且不需要领域相关的知识,因此通用性也较好。本文围绕协同过滤中的评分预测问题,以矩阵分解模型为基础,从两个