【摘 要】
:
高通量分子模拟方法已经被证明是一种从庞大的金属有机框架(MOFs)数据库中筛选具有潜在应用前景MOFs材料的有力的手段。但是利用传统的高通量分子模拟方法对几十万个MOFs材料进行逐个筛选的效率太低。因此,寻求加速高性能MOF材料筛选的方法势在必行。本文的第一个工作利用机器学习方法(Maching Learning,ML)来加速高CO2/CH4分离性能的MOFs材料筛选过程。本研究首先应用巨正则蒙特
论文部分内容阅读
高通量分子模拟方法已经被证明是一种从庞大的金属有机框架(MOFs)数据库中筛选具有潜在应用前景MOFs材料的有力的手段。但是利用传统的高通量分子模拟方法对几十万个MOFs材料进行逐个筛选的效率太低。因此,寻求加速高性能MOF材料筛选的方法势在必行。本文的第一个工作利用机器学习方法(Maching Learning,ML)来加速高CO2/CH4分离性能的MOFs材料筛选过程。本研究首先应用巨正则蒙特卡洛模拟(GCMC)对G-MOFs数据库中10%的材料进行模拟计算。基于这些数据,经过特征选择,以6种MOF材料的属性作为输入,以材料的TSN分离评价指标作为输出,训练了6个ML预测模型。结果表明XGBoost模型的预测精度最高,在测试集上R~2达到了0.92,MAE仅仅为4.67。然后基于构建的XGBoost模型对数据库中余下的MOFs材料进行快速预测筛选,最终找到了8个TSN指标超过300的MOFs材料以及195个TSN指标超过200的MOF材料。对XGBoost模型预测找到的高性能的材料进行GCMC,结果表明本研究训练得到XGBoost模型展现出良好的预测泛化性能。同时为了发挥出ML模型的数据挖掘的强大功能,引入SHapley Additive ex Plantions(SHAP)可解释统计学方法对MOF材料的构效关系进行分析。本文在对数据库中10%的材料进行GCMC计算代价下,结合ML预测模型实现了对材料的快速筛选预测,性能方面比传统的对每个材料逐个进行GCMC的方法更加高效。ML方法可以加速高性能MOF材料筛选,但是只能局限于原始MOF数据库这一较小的材料空间。因此,本研究的第二个工作基于一种新的遗传算法来搜索和生成原始库之外的高CH4存储性能的MOF材料。由于传统的遗传算法容易陷入局部最优,本文首先对标准遗传算法进行改进并提出了一种新的自适应遗传算法(Tantative Adaptive Genetic Algorithm,TAGA),该方法在标准测试函数上展现出比其他自适应遗传算法更优的搜索性能。以TAGA为主体,通过对MOF材料构建块进行编码,并以一种高精度的ML模型作为适应度函数,来搜索原始数据库空间之外的高CH4存储性能的MOF材料,最终找到了27个性能超过原始数据库最优材料的MOFs个体。进一步地,结合材料组装软件MGPNN对搜索到的MOF个体进行材料组装并应用GCMC进行性能验证,结果显示组装生成的材料中性能最高达到了580.73 cm~3(STP)/g,远远超过了原始库中材料的最佳性能。本研究提出的材料生成方法不仅加速了MOF材料的筛选过程而且更重要的是实现了库外材料空间中高性能材料的生成。这一方法为材料研究者进行高性能MOF材料的设计和生成提供了一条新的思路。
其他文献
英语学习的各项活动围绕同一主题进行,有助于解决英语学习碎片化、单一化的问题。在主题语境阅读教学中,教师可利用文字云图、思维导图、语篇信息表、鱼骨图、文化记录卡、读后自我评价表等可视化工具,引导学生完成对信息的获取与梳理、概括与整合、内化与运用,促进学生语言能力、文化意识、思维品质和学习能力的融合发展。
主题语境是英语课程的核心要素之一,主要关注人与自我、人与社会、人与自然之间的关系。可以说,高中英语课堂上的所有英语输入与输出活动,都能被囊括在以上三种关系的范围之内。因此,基于主题语境的阅读不仅能够帮助学生理解知识内容本身,还关系到培育学生的情感态度与价值观,拓展学生的眼界,促进学生的思考,锻炼学生的思维能力,增强学生的英语学科核心素养,使得英语知识技能真正成为对学生有用的能力。本文将从几个不同的
随着Android应用软件数量的急速增加,其质量越来越受到人们的重视。软件测试是保障Android应用质量的重要途径,测试用例生成是自动化测试的关键。反射机制可有效提高程序的灵活性及扩展性。研究显示,在Google Play中,将近88%的Android应用使用了反射。而面向Android应用反射的测试生成技术,因其反射代码覆盖率及测试生成效率低等原因,仍将是未来研究的热点和难点。目前,基于模型的
乳腺癌相关失眠贯穿乳腺癌始终,是临床亟待解决的问题。许多学者在围绕中医治疗乳腺癌相关失眠方面进行了广泛探索。本文从中医对该病的病机认识、辨证分型、临床研究情况进行总结。中医内治以疏肝理气、重镇平肝、养血柔肝、清肝滋肾、交通心肾、健脾养肾、益气养阴、气血双补为主,结合穴位贴敷、推拿、雷火灸及针刺等外治疗法,具备多维度、多层次的综合干预优势,可作为低成本、低风险的临床辅助或替代治疗。但也存在辨证分型尚
医用恒温箱是一种常见的医疗器材,主要用于医用药品和实验试剂的保温,因此医用恒温箱对于温度控制有着很高的要求。作为典型的温度控制器件,医用恒温箱温度模型具有大惯性、时变性和不确定性。本文从三个方面对医用恒温箱的温度调节器进行设计和优化:医用恒温箱的温度模型辨识、温度调节器的设计和调节器的控制参数调优和优化。本文采用最小二乘辨识算法来获取医用恒温箱的温度模型参数。在此基础上,本文依据被控对象实际输出和
阅读是高中英语教学体系的重要组成部分,新课程标准提倡运用主题语境为学科育人提供话题和语境,要求教师引导学生在不同主题语境下理解语篇内涵、提高阅读水平。由于主题语境在英语阅读教学中的运用较多,且高中学生对主题语境的理解程度将直接影响其思维发展和语言学习,所以,教师应当致力于探索全新的阅读教学模式,围绕教学主题来创设语境,让学生在阅读的过程中,充分理解主题意义,养成良好的英语学习习惯,不断提高阅读理解
无论对于动物还是人类而言,各类烈性传染病都是生命健康的严重威胁,例如非洲猪瘟,及2019年底突发的新冠肺炎(COVID-19),分别给农业生物安全及公共生物安全造成了重大的负面影响。尤其是,新冠肺炎给全世界的社会、经济、生命健康等诸多方面带来了异常巨大的损失。因此,研究各类新型的疾病检测技术、方法及装置,实现疾病的快速、精准、高效检测,对于构建维护人类乃至动物生命健康的守护防线具有重要的现实意义与
现实世界中有很多具体的应用问题,都可以被抽象成最大团问题(Maximum Clique Problem)或是与最大团问题相关,比如社团划分、投资方案选择等问题。此外,最大独立集问题、图顶点着色问题等经典理论问题,也会应用到最大团探测算法。最大团问题具有很高的研究价值。最大团问题的目标是在一个给定网络中,找到一个顶点数最多的完全子图。目前已有的最大团算法可以分成两类:准确算法和启发式算法。准确算法保
随着社会节奏增快以及生活方式的改变,乳腺癌的发病率和死亡率持续上升。目前靶向疗法在乳腺癌的治疗中前景良好,已发现多种蛋白靶点在乳腺癌的发生发展中扮演重要角色,其中信号转导和转录激活蛋白(STAT)是一组信号转导和转录激活蛋白,是传导细胞转录信息的重要靶点,该靶点可通过对下游细胞增殖、凋亡、细胞迁移、侵袭及血管生成因子等进行调节,进而影响乳腺癌的进展。STAT家族与肿瘤炎症反应密切相关,在肿瘤的发生
由于客观条件的约束,如信噪比的传输与传感器的设计,卫星所获取图像的空间与光谱分辨率存在互补关系。为便于完成后续的目标识别、地物分类等任务,则需要空间与光谱均高保真的图像。图像融合旨在将多幅图像通过其中存在的关系,利用合适的算法将它们各自的关键信息与特征进行融合,让图像具有更加丰富的色彩与纹理细节,更接近人眼视觉,因此图像融合必不可少。图像融合可根据待融合影像的时相分为两类:一是同时相影像融合;二是