论文部分内容阅读
由于化石燃料储备有限以及日益严峻的环境问题,在过去的数十年中对可再生能源的需求急剧增加。太阳能的高效利用有望成为解决能源与环境问题的一个关键突破口。在太阳能的众多利用形式中,太阳能电池提供了一种经济的方式,能够直接将太阳能转化为电能。传统的硅基太阳能电池在制备过程中需要复杂的工艺且成本昂贵,而电池的刚性则限制了其在可穿戴、柔性器件中的应用。在新一代太阳能电池中,有机太阳能电池具有轻质、柔性、可连续溶液法制备等优势,因而受到广泛关注。
开发设计具有高光电转换效率的新型有机分子是目前有机太阳能电池领域的研究热点。但是新分子的设计合成一直受限于传统的材料开发模式,即试错法。该方法需要大量的时间和资源来设计、测试新材料。因而有机太阳能电池材料的开发效率一直较低,自1973年首次报道以来,仅在光伏器件中测试了不到2000种有机太阳能电池给体材料分子。此外,目前新材料设计仍然需要人为根据以往的经验进行,存在一定的盲目性。且与高性能材料相关的分子结构特征及重要基团尚不明确。为了解决这些问题,提高材料开发的效率并充分利用好已有的实验数据,本文利用机器/深度学习算法建立有机太阳能电池给体材料化学结构与光电转换效率的关系,实现了对新给体材料进行快速评估。同时与实验紧密结合,使用机器学习辅助甚至直接指导新材料的开发。
以往的研究中通常需要进行高通量、高精度的第一性原理计算获得材料的微观性质作为机器学习模型的输入,但是计算成本同样高昂。在第二章中,我们首先探索了使用材料化学结构的图片建立结构-光电性质的可行性。深度学习被证明可用于快速评估新型有机太阳能电池材料的性能。本文构建的模型允许直接使用化学结构的图片作为输入,具有出色的非线性分析能力,并且对计算能力的需求较低。在使用哈佛清洁能源项目数据库训练二分类模型之后,最优模型在独立验证集上的预测准确率达到91.02%。通过将模型的数据处理过程可视化,发现深度学习模型可以自动提取化学结构中的特征,如特殊元素、化学键等。
由于哈佛清洁能源项目数据库中的虚拟分子尚未经过实验合成,且分子结构相较于文献实际报道的更为简单。在第三章中我们进一步收集了自有机太阳能电池问世以来已发表的文献,记录给体材料分子结构以及对应器件的光电性能参数,建立了有实验基础的有机太阳能电池给体材料数据库。为了对机器学习方法在材料领域的应用(尤其是使用小数据库)提供一些指导和建议,本文基于该数据库研究了分子的不同机器语言表达形式(包括图像,ASCII字符串,描述符和分子指纹)对模型预测性能的影响。发现长度超过1000位的分子指纹可以获得较高的预测准确率。且分子指纹易于获得,因此非常适合作为机器学习模型的输入来预测给体材料的光电转换效率。此外,使用机器学习模型评估了10种新材料并对其进行实验验证。模型的预测和实验结果之间获得了良好的一致性,这既验证了机器学习方法的可靠性,又表明机器学习可用于实验前的高通量材料筛选,从而辅助新材料的开发。
在第四章中,本文继续挖掘机器学习的先进功能以及大量数据中的潜在价值,并尝试使用机器学习实现高性能有机太阳能电池给体材料的自动设计。在使用机器学习对数据库中的分子进行子结构重要性分析以及对子结构出现频率进行统计之后,发现了与给体分子的高光电转换效率相关的关键基本单元。通过基本单元在两种有前景的主链上进行拼装组合,一共构建了18960个全新的小分子给体材料。使用机器学习模型对新分子进行快速筛选,并得到了6337个预测效率大于8%的候选材料。在与受体分子Y6进一步匹配后,有希望的材料显示出超过15%的预测光电转换效率。利用第一性原理计算研究了这些分子的电子结构,结果显示它们具有高效载流子输运的巨大潜力,因而有望成为高性能给体材料。该工作说明本文提出的基于机器学习的材料设计框架可根据模型从数据中发现的知识设计新材料。此方法同样适用于其他领域,因此有望使新材料开发更为高效。
总之,机器学习方法在材料开发中极具应用前景。不仅可以预测材料的性质从而实现对新材料的快速评估及筛选,而且可以发现重要基团并实现新材料设计。
开发设计具有高光电转换效率的新型有机分子是目前有机太阳能电池领域的研究热点。但是新分子的设计合成一直受限于传统的材料开发模式,即试错法。该方法需要大量的时间和资源来设计、测试新材料。因而有机太阳能电池材料的开发效率一直较低,自1973年首次报道以来,仅在光伏器件中测试了不到2000种有机太阳能电池给体材料分子。此外,目前新材料设计仍然需要人为根据以往的经验进行,存在一定的盲目性。且与高性能材料相关的分子结构特征及重要基团尚不明确。为了解决这些问题,提高材料开发的效率并充分利用好已有的实验数据,本文利用机器/深度学习算法建立有机太阳能电池给体材料化学结构与光电转换效率的关系,实现了对新给体材料进行快速评估。同时与实验紧密结合,使用机器学习辅助甚至直接指导新材料的开发。
以往的研究中通常需要进行高通量、高精度的第一性原理计算获得材料的微观性质作为机器学习模型的输入,但是计算成本同样高昂。在第二章中,我们首先探索了使用材料化学结构的图片建立结构-光电性质的可行性。深度学习被证明可用于快速评估新型有机太阳能电池材料的性能。本文构建的模型允许直接使用化学结构的图片作为输入,具有出色的非线性分析能力,并且对计算能力的需求较低。在使用哈佛清洁能源项目数据库训练二分类模型之后,最优模型在独立验证集上的预测准确率达到91.02%。通过将模型的数据处理过程可视化,发现深度学习模型可以自动提取化学结构中的特征,如特殊元素、化学键等。
由于哈佛清洁能源项目数据库中的虚拟分子尚未经过实验合成,且分子结构相较于文献实际报道的更为简单。在第三章中我们进一步收集了自有机太阳能电池问世以来已发表的文献,记录给体材料分子结构以及对应器件的光电性能参数,建立了有实验基础的有机太阳能电池给体材料数据库。为了对机器学习方法在材料领域的应用(尤其是使用小数据库)提供一些指导和建议,本文基于该数据库研究了分子的不同机器语言表达形式(包括图像,ASCII字符串,描述符和分子指纹)对模型预测性能的影响。发现长度超过1000位的分子指纹可以获得较高的预测准确率。且分子指纹易于获得,因此非常适合作为机器学习模型的输入来预测给体材料的光电转换效率。此外,使用机器学习模型评估了10种新材料并对其进行实验验证。模型的预测和实验结果之间获得了良好的一致性,这既验证了机器学习方法的可靠性,又表明机器学习可用于实验前的高通量材料筛选,从而辅助新材料的开发。
在第四章中,本文继续挖掘机器学习的先进功能以及大量数据中的潜在价值,并尝试使用机器学习实现高性能有机太阳能电池给体材料的自动设计。在使用机器学习对数据库中的分子进行子结构重要性分析以及对子结构出现频率进行统计之后,发现了与给体分子的高光电转换效率相关的关键基本单元。通过基本单元在两种有前景的主链上进行拼装组合,一共构建了18960个全新的小分子给体材料。使用机器学习模型对新分子进行快速筛选,并得到了6337个预测效率大于8%的候选材料。在与受体分子Y6进一步匹配后,有希望的材料显示出超过15%的预测光电转换效率。利用第一性原理计算研究了这些分子的电子结构,结果显示它们具有高效载流子输运的巨大潜力,因而有望成为高性能给体材料。该工作说明本文提出的基于机器学习的材料设计框架可根据模型从数据中发现的知识设计新材料。此方法同样适用于其他领域,因此有望使新材料开发更为高效。
总之,机器学习方法在材料开发中极具应用前景。不仅可以预测材料的性质从而实现对新材料的快速评估及筛选,而且可以发现重要基团并实现新材料设计。