基于机器学习和区块链材料数据库的晶体结构分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jk224wang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
材料的组分和晶体结构决定了材料的性能,因此晶体结构表征是材料发展的重要任务之一。粉末X射线衍射(XRD)是阐明晶体结构的主要实验技术,使用该技术获得的晶体衍射数据可以用于识别特定的数据和相组成,通过分析XRD图像来获得晶体结构信息会涉及到峰的标定、空间群确定、晶体结构初始参数估计等几个步骤。目前XRD分析技术在很大程度上仍然是手工的、耗时的、容易出错的,而且无法扩展。通过机器学习的方法,可以大大加快人们手工分析的过程,并有助于实现高通量实验。人工智能可以对XRD进行识别和分类,加速了XRD分析的速度,大大加速材料分析的进程。本文提出了一种基于机器学习进行晶体结构分类的方法,通过收集大量的数据和使用经研究设计的特征工程,建立多种分类模型进行晶体结构的分类预测和相的识别,帮助后续实验人员更快将复杂的X射线衍射图谱识别出晶体结构以及相组成。通过爬虫技术从Materials Project和ICSD上爬取了13万多条XRD数据,同时还包括了化学式、空间群、晶体系统等。将这些数据进行清洗和筛选,并选取了2θ范围为0°~90°的所有衍射峰,去除一万个左右的原子位置缺失的数据等方法,最后一共使用了10万多张XRD图谱,建立特征工程后,使用了KNN、决策树、随机森林、逻辑回归算法、卷积神经网络对晶体空间群结构进行分类,对相结构进行预测。在多晶系分类上准确率最高达到93%;在预测点群和空间群上准确率最高达到90%;在预测相结构上,基于X射线衍射的特性,使用数据扩增技术将实验XRD数据增加到3万个,通过卷积神经网络成功将XRD多相混合物进行预测,成功率最高能达到99%。对机器学习中的材料数据管理的价值性、数据的完整性、数据共享及更新、数据检索的快速性等方面进行了分析和研究,开发了去中心的材料数据库系统DMDB。本研究设计以Ethereum,My SQL,IPFS为存储层,以Java微服务系统为调度中心的系统架构,并编写了以下几个模块:账户认证与鉴权、文件上传及上链、预测模型微服务、后台模块的开发等等。主要功能为:用户检索机器学习材料数据、上传材料数据、下载数据、预览XRD数据和在线预测晶体结构和相组成。DMDB数据库解决了材料机器学习中数据量不够,源数据未清洗等问题,通过区块链技术实现去中心化从而提高数据价值,根据材料的特性,建立合理的数据库字段,从而加速人工智能在材料领域的研发过程。
其他文献
背景:生命早期阶段不良的环境因素可能通过DNA甲基化等表观遗传学机制改变细胞的基因表型,最终影响糖尿病、高血压等胎源性疾病的发生发展。叶酸(folic acid,FA)是体内重要的甲基供体,参与DNA的复制与甲基化。因此,从一级预防的角度探讨叶酸补充对成年糖尿病的影响有利于护理人员做好孕期保健,合理规范孕妇的营养和行为,降低子代成年后发生糖尿病的风险。本课题组前期实验结果证明,孕期低剂量内毒素(L
学位
稀土掺杂上转换纳米材料可以通过非线性过程实现反斯托克斯发射,将近红外波段的低能量激发光子通过上转换过程转变为可见光或紫外波段的高能量发射光子。稀土掺杂上转换纳米晶体已成为近年来相关研究的热门材料之一,因其不仅具有这种独特的近红外激发能力,并且还具有巨大的反斯托克斯光谱位移、尖锐的发射带、多色发射和较长的发光寿命等优异的发光特性。此外,许多高品质稀土掺杂上转换纳米颗粒的成功合成更是为其在许多应用领域
学位
石墨烯纳米片以其优异的机械性能、热性能和耐腐蚀性能备受关注,并应用在诸多领域。但石墨烯纳米片宏量制备工艺复杂、环境污染大、成品缺陷多、产量低,使得其价格高、供应量低、应用受限。本课题研究液相高速剪切剥离法制备水相和油相石墨烯纳米片分散液,并分别用于水泥和环氧树脂改性,以期改善其复合材料性能,满足不同的应用需求。针对无机水泥体系特性,研究水相体系石墨烯纳米片液相高速剪切制备工艺。通过剪切方式、剪切速
学位
硒化钯(PdSe2)作为一种新型的低维半导体材料,具有性质稳定、高载流子迁移率、可调窄带隙、高催化活性等优点,是应用于光电子器件、电解水催化剂的理想候选材料。目前化学气相沉积法(CVD)是实现PdSe2大规模可控制备的主要手段,然而合成的材料尺寸小、反应温度高和前驱体昂贵。本文提出一种低成本且工艺简便的溶液辅助CVD法,即预先在衬底上负载前驱体再CVD硒化的方法,通过浸渍、旋涂、气体辅助的不同负载
学位
目的本研究全面探究系统性红斑狼疮(SLE)患者睡眠障碍的影响因素,构建了SLE患者睡眠障碍的预测模型并进行内部验证,以期快速为临床医务工作者提供早期干预的方向,进而提高SLE患者睡眠质量。方法采用便利抽样法,选取安徽省立医院风湿免疫科、安徽医科大学第一附属医院风湿免疫科及安徽医科大学第二附属医院肾脏内科的住院患者284例。通过文献回顾及前期荟萃分析研究基础选定研究变量和工具,采用匹兹堡睡眠质量指数
学位
目的检验自行开发的网络健康信息可读性评价工具在护士群体中的信度和适用性;邀请临床护士应用修订后的工具评价糖尿病网络健康信息的可读性水平,并基于评价结果提出改进策略。方法本研究分为二个阶段:第一阶段:网络健康信息可读性评价工具的信度和适用性测试。依据构建的可读性评价指标体系中的一级指标设置评价维度,依据二级指标设置评价条目,编制《网络健康信息可读性评价问卷》(以下简称《可读性评价问卷》)及《网络健康
学位
严重的环境污染和能源危机促使金属空气电池和碱性膜燃料电池等可再生清洁能源技术不断开发。但是实现可再生清洁能源技术的大规模应用的主要困难是设计并合成高活性电催化剂以加速缓慢四电子氧还原反应(ORR)。目前,铂族金属(PGM)催化剂,尤其是铂(Pt),仍然被认为是最有效的ORR电催化剂。然而,PGM催化剂的的高成本以及稀缺性严重的限制了其广泛应用。开发具有高活性、超稳定和低成本的非贵金属催化剂以替代P
学位
在现代科学技术发展的环境下,能源对人类生活的影响愈加重大。目前,探索和研究高节能、高效率的新能源材料成为了解决可持续发展的核心途径。超导材料以其独特的零电阻效应和完全抗磁性,能够在电力、交通等领域展现出非凡的前景。在某种低温条件下,部分金属或合金化合物将转变为超导体。利用这种特性,人们便可以制作出超导电线以减少电力运输中的损失。同时,设计出磁悬浮列车以减少轨道摩擦,大幅度提高在交通上的运载速率。然
学位
涡轮叶片是发动机的关键动力部件,单晶发动机叶片形状及内部结构复杂多样加上其制备工艺严格,制造过程中的杂晶、裂纹、气孔等缺陷使得国内成品率较低,服役过程中由于工作环境恶劣,产生裂纹、变形、腐蚀坑、甚至烧穿等损伤缺陷在所难免,由此造成了发动机叶片的大量报废,使得发动机运行成本大幅增加,经济代价巨大。而在发动机叶片修复技术方面我国与国外相比依旧存在着较大的差距,随着国外技术封锁加剧,攻克受损单晶叶片修复
学位
背景胰岛素抵抗(IR)是高血压发病的核心病理生理机制之一,甘油三酯葡萄糖指数(TyG指数)被视为IR的一项新型替代生物学指标。目前国内外关于TyG指数对高血压影响的研究结论尚存争议,以横断面研究居多,缺乏纵向资料数据支持。目的了解某高校教师高血压流行病现状,探索甘油三酯葡萄糖指数(TyG指数)与高血压发病风险的关联及与血压值的定量关系,以期为临床高血压事件的早期筛查及高危人群的分层管理提供简单有效
学位