【摘 要】
:
随着大数据时代的到来,亟需设计高效的机器学习算法来分析大规模数据。在实际情况中,数据通常由多个参与方生成。有些数据可能涉及到隐私等安全问题,数据存在孤岛和垄断现象,对需要大量数据完成训练的模型构建任务极为不利。数据的存储、安全和传输问题激发了区块链的研究。区块链科技在近年来也获得了多国政府部门的资金支持,且发展势头很快,其迅速发展也受到了社会各界的普遍重视。本文结合区块链和机器学习,设计了一种在H
论文部分内容阅读
随着大数据时代的到来,亟需设计高效的机器学习算法来分析大规模数据。在实际情况中,数据通常由多个参与方生成。有些数据可能涉及到隐私等安全问题,数据存在孤岛和垄断现象,对需要大量数据完成训练的模型构建任务极为不利。数据的存储、安全和传输问题激发了区块链的研究。区块链科技在近年来也获得了多国政府部门的资金支持,且发展势头很快,其迅速发展也受到了社会各界的普遍重视。本文结合区块链和机器学习,设计了一种在Hyperledger Fabric区块链上进行机器学习的架构,帮助解决机器学习中数据安全相关问题。以实证研究的方式,探讨了在Hyperledger Fabric链上机器学习的有效性问题。针对电信运营商客户流失数据集上构建相同参数组合的两种分类模型——逻辑回归和决策树,并分别在链上、链下进行机器学习。通过可视化分析,从用户类型、服务属性、合同信息三个角度找出了高流失客户的特征,并据此输出了高流失客户画像。在链下对数据集做出了一系列预处理工作,如数据转换、数据清洗等。为了减少数据冗余,结合数据分析和皮尔森相关系数方法进行了特征选择,剔除了对结果影响较弱的3个特征。模型训练过程中,为进一步提高分析准确度,通过网格搜索结合交叉检验以及设定不同阈值,确定了最佳的建模数据选择。链上逻辑回归模型分类精度为81.59%,与链下的结果一致。同样的,链上决策树模型以82.50%的分类精度略高于逻辑回归模型,其精度也与链下完全一致。实验证明,逻辑回归与决策树分析模型在同一数据集、相同参数组合下,在链上的分类精度与链下完全一致。链上机器学习是可行并有效的,在解决了机器学习中数据安全相关问题的同时,通过链上智能合约的部署,机器学习模型构建只需要调用合约命令即可完成,大大提高了工作效率。
其他文献
近年来,墨水直写成形(Direct ink writing,DIW)技术作为3D打印的形式之一,在可穿戴电子、柔性器件等领域有很大的发展前景。导电UV墨水以其良好的柔性与导电性为柔性电子的发展提供了更多可能。但UV墨水在直写成形过程中存在直写线条不均匀及叠加线条成形表面不平整等问题。本文以UV墨为直写成形材料,研究直写成形单线条的影响规律,分析线条叠加的沉积过程,研究UV墨线条的固化,以及UV墨线
沉浸式可视化是随着虚拟现实技术和数据可视化的发展而衍生出的新兴研究领域,它充分利用人们的感知操作能力,通过沉浸式交互界面为可视化的数据分析、推理决策提供支持。虽然二维平面中各类数据可视化方法比较丰富,但复杂的人物关系数据可视化方法不容易被人们感知理解,很容易造成视觉负担不利于数据分析。沉浸式可视化中的三维空间相比二维平面增加一个维度,能够编码更多数据信息,且三维空间中的沉浸性与交互性为数据探索分析
在移动应用用户界面日趋同质化的今天,界面中任何一个元素都关乎了用户的操作体验,悬浮按钮作为独特的移动应用用户界面组件凭借着外观新颖、操作便捷的特点,受到设计师的喜爱并不断被应用于移动应用用户界面设计。移动应用用户界面的设计是目前学术界研究的热点课题,但关于重要界面元素悬浮按钮的研究则少有论及。本研究采用了文献研究法和案例分析法两种研究方法,对悬浮按钮的设计原则和设计方法进行研究。首先,阐述了悬浮按
中华文化起源于农业文明,农业社会特别关注饮食,民以食为天。中原饮食文化源远流长,是中华文化的重要组成部分。媒介融合时代,中原饮食文化的传播面临着新的挑战与机遇。本文以中原饮食文化视频作为研究对象,总结其传播特点,梳理其传播现状,通过初步的探索、研究、归纳整理后,发现中原饮食文化视频传播中的问题,并有针对性地提出媒介融合背景下中原饮食文化视频传播的策略,以期探寻出中原饮食文化传播的创新发展之路。论文
随着中国软包装印刷工业的迅速发展,以及人民生活条件的日益改善,印刷车间的环境问题引起了人们的高度重视。印刷车间的各种环境因素会直接影响印刷品的质量、车间工人舒适度以及车间的生产效率。所以一个良好的生产作业环境对保证车间的正常生产和印刷品质量有着不容小觑的意义。随着网络技术的发展,泛在感知网络可以实时、准确地对软包装印刷车间环境数据进行监测和处理。但是,监测越精准需要采集和存储的数据量就会越大。因此
站在新的历史发展阶段,中国的工业企业朝着《中国制造2025》的方向稳步迈进。随着5G、大数据、云计算等新兴的信息化技术的广泛应用,软包装生产企业生产和业务环节会产生海量的数据,但是我国大部分的印刷包装生产企业为中小型企业,他们对这些数据的存储和分析都存在着不小的困难。企业在生产信息化的进程中由于信息交互不通畅、数据得不到充分的利用,很难把握生产改进的方向与流程优化方向,帮助企业解决数据存储与分析问
随着人们对印品质量和需求的不断提高,印刷技术的不断发展和进步,墨层厚度检测技术早已成为印品质量检测必不可少的手段之一。墨层厚度合适与否直接影响了印品质量的好坏,当墨层厚度值太小时会导致轮廓反差变小,鲜艳度差,光泽度不足等问题;而当墨层厚度值太大时,会产生严重的网点增大,引起并级现象,并且会使油墨干燥变慢造成印品背面粘脏,出现这些问题时会严重影响印刷品的质量,因此对墨层厚度的检测在印刷领域中具有重要
2020年初爆发的疫情使得医用手套出现了供不应求的局面,这就对在保证医用手套漏气检测精度情况下提高效率和后续的收集整理流程提出了更高的要求,但是传统的手套漏气检测方法以及后续的手套收集整理过程效率太低,落后的产能无法满足当前的需求,市场上迫切需要一套手套自动收取装置来完成这个任务。手套自动收取装置包括了手套漏气检测系统,手套左右手的识别系统,手套与夹具分离系统,手套运输系统,手套左右手的分离系统,
水性上光机采用水性上光油对印品表面进行上光复合,具有无毒、无污染的特点。印品经过上光复合之后,需采用干燥设备对表面进行干燥。目前的水性上光油干燥过程采用红外干燥的方式,耗能较大。因此,寻找绿色、经济、耗能低的水性上光油干燥设备是亟待解决的研究问题。相比于传统红外灯管,碳系热源具有更高的电热转换率,是水性上光机干燥热源的理想选择。其中,干燥设备中碳系热源的制备工艺及电热性能是重要的关键技术。本文通过
改革开放后的中国,经济势态一路高歌猛进,取得了举世瞩目的成就,自“十二五”时期中国经济长期以来也积累了一些结构不合理等问题,主要体现在以钢铁行业为代表的工业领域中,这些行业严重的产能过剩、低效的资源配置等问题日益突出。随着我国经济发展供给链的不断完善,出现一些大型国有企业严重占用国家资源等阻碍经济发展的问题,“僵尸企业”是国企改革的难点和关键。僵尸企业的生产和目前我国的需求已经严重脱节,还存在占用