【摘 要】
:
化学品的环境持久性是影响其环境暴露水平的重要因素。筛选具有环境持久性的化学品,对化学品风险管理具有重要意义。仅通过实验方法获取化学品环境持久性参数,效率低、耗时长且成本昂贵,需要发展高效(高通量、低成本)的模拟预测技术。基于定量构效关系(QSAR)的计算模拟技术,通过建立化学品分子结构特征与其环境行为参数的关联,可有效预测化学品环境持久性参数。本研究使用分子结构描述符结合多种机器学习算法,构建预测
论文部分内容阅读
化学品的环境持久性是影响其环境暴露水平的重要因素。筛选具有环境持久性的化学品,对化学品风险管理具有重要意义。仅通过实验方法获取化学品环境持久性参数,效率低、耗时长且成本昂贵,需要发展高效(高通量、低成本)的模拟预测技术。基于定量构效关系(QSAR)的计算模拟技术,通过建立化学品分子结构特征与其环境行为参数的关联,可有效预测化学品环境持久性参数。本研究使用分子结构描述符结合多种机器学习算法,构建预测化学品快速生物降解性及化学品在四种介质(大气、水体、土壤、沉积物)中降解半减期(t1/2)的QSAR模型,主要内容如下:(1)构建了预测化学品快速生物降解性的QSAR模型。从相关文献和开源软件中搜集得到2043个有机化学品快速生物降解性数据,建立了化学品快速生物降解性数据库。使用12种分子指纹和6种机器学习算法构建了72个预测快速生物降解性的单个模型。分子指纹使用Pa DEL-Descriptor软件计算,机器学习算法包括K近邻、逻辑回归、伯努利朴素贝叶斯、决策树、随机森林、支持向量机。采用十折交叉验证和外部验证评价模型的稳健性和外部预测能力。使用单个模型中表现良好的分子指纹和算法,进一步构建了28个集成模型,并基于分子相似性对最优集成模型进行应用域表征。结果表明,与单个模型相比,集成模型具有更好的拟合能力、稳健性和泛化能力。基于分子相似性,对最优集成模型应用域进行表征,发现设置合适的应用域范围,能显著提高模型泛化能力。(2)构建了预测化学品在四种介质中t1/2的QSAR模型。从相关文献和理化性质手册中搜集了250种有机化学品在四种介质中的t1/2数据,使用Mordred描述符和12种分子指纹,结合多层前馈神经网络算法,分别建立了预测化学品在每种介质中t1/2的单任务(ST)神经网络模型。在此基础上,根据输入模式的不同,构建了两类可同时预测t1/2(大气),t1/2(水体),t1/2(土壤)和t1/2(沉积物)的多任务神经网络模型,分别为单输入多任务(SIMO-MT)模型和多输入多任务(MIMO-MT)模型。结果表明,MT模型预测性能比ST模型更好,可能因为多任务学习在模型构建过程中捕捉到了任务间的关联信息,在模型训练时进行共享,从而提高了每个任务的预测效果。基于分子相似性方法,对MIMO-MT模型应用域进行表征。本研究所构建模型可高效筛查具有环境持久性化学品,为化学品风险评价提供技术支持。
其他文献
空气源热泵作为清洁取暖的最佳热源之一,其系统在区域供暖中被广泛使用。为了实现系统能够在部分负荷工况下的多级能量调节,提升系统效率,前人提出了空气源热泵系统并联的概念,为了保证并联系统压缩机吸气和蒸发器供液均匀,本文提出了气液均衡并联空气源热泵系统,并对其制热性能进行了系统且全面的试验和理论研究。首先,对气液均衡并联空气源热泵系统的构成以及工作原理做了介绍,并在冬季制热工况下进行了热力计算,在此基础
Ni3Al金属间化合物具有高熔点、低密度和良好的抗氧化性等特点,非常适合在高温环境下服役,然而,金属间化合物普遍存在的室温脆性问题极大地限制了其实际应用。因此本文通过“团簇加连接原子”模型对Ni3Al金属间化合物进行成分和结构解析,并据此进行了合金成分设计,意在保证Ni3Al基金属间化合物高强度的同时,改善其在室温下的脆性。并且通过对比分析不同成分的合金的微观组织和性能,得出合金成分设计对微观组织
这是一篇矿物加工工程领域的论文。本文以河南某稀土及伴生萤石资源为研究对象,依据工艺矿物学和小型选矿实验所得的研究结果,进行了处理量为60 kg/h的扩大连续实验。通过化学分析、AMICS镜下鉴定等分析手段发现,该原矿样品中主要有用元素REO含量为1.53%,CaF2含量为18.22%,稀土选别目标矿物为氟碳铈矿和氟碳钙铈矿;采用“稀土、萤石混合浮选-稀土、萤石分离”的工艺对矿石中的稀土、萤石进行回
微小螺纹副连接广泛存在于微小零件的精密装配中,其中采用成对微小螺纹副连接的框架组件是一种具有双转动自由度的组件,螺纹预紧程度及预紧的一致性对框架组件的性能产生重要影响。由于组件结构紧凑、尺寸小等特点,导致手工装配时受操作人员技能影响大。自动化精密装配技术具有装配一致性高、装配过程参数可测可控等特点,因此本文研制一套适用于框架组件装配的自动化装调系统,围绕框架组件的自动化装配技术和精度指标,针对组件
随着互联网技术的快速发展,信息技术在我国各行业领域都得到了广泛运用,为很多行业的发展提供了动力与便利性。医院档案管理工作是确保整个医院有序运转的重要部门,而信息技术在医院档案管理工作中的有效运用,给医院档案管理工作注入了活力与动力,从而推进了医院档案管理工作效率的稳健提升。在传统的医院档案管理模式下主要是以办公纸质化模式来开展,但是随着绿色环保理念的不断深入,当下无纸化办公才是档案管理工作的未来发
核能是重要的清洁能源,构建以核电站为热源的核能热电联产供热系统是实现“双碳”目标的有效途径之一。目前,中国核能热电联产系统的相关研究和实践处于起步阶段,在评价、规划、设计、运行、调节、标准化等各方面都存在诸多问题亟待解决。本研究针对我国核能热电联产综合效益评价和核能长输供热设计问题,采用理论分析、实际调研、案例研究等方法开展研究。首先,对核能热电联产系统形式及热力特性开展分析,从热源侧和管网侧两个
抽水蓄能电站作为经济环保的储能技术,具有调峰填谷、调频调相等作用,是建设现代化智能电网的重要支撑,是构建清洁低碳、安全稳定、经济高效的现代电力系统的重要组成。到2035年,我国将形成技术先进、管理优质、国际竞争力强的抽水蓄能现代化产业。因此,抽水蓄能电站的发展建设,对于实现“碳达峰、碳中和”目标,构建以新能源为主题的新型电力系统,具有重要意义。早期国内外抽水蓄能电站建设过程中因缺乏拦污栅设计经验,
行为金融理论从理论和实证角度分析了资产价格偏离资产价值的存在性及其持续性,证明了金融市场的无效性,指出投资者情绪对资产价格的影响机理。然而,现有关于投资者情绪如何影响资产价格主要从市场情绪、散户情绪以及机构情绪层面展开,较少刻画投资者情绪的微观结构对资产价格的影响。本文聚焦投资者情绪的微观结构,采用均值回归过程刻画投资者情绪的微观形成机理,构建基于均值回归投资者情绪的资产定价模型,从理论层面解释股
乳腺癌是全球女性死亡的主要原因,与其他国家一样乳腺癌已经成为中国女性最常患的癌症。每年的新发数量与死亡数量逐步增长,并且乳腺癌开始趋于年轻化,所以乳腺癌的治疗与预后值得深入研究。泛素化是一种常见的翻译后蛋白质修饰,可以调节多种生理或病理过程,尤其是肿瘤的发生和凋亡。但这一种翻译后修饰是可逆的,它是由去泛素化酶这个大家族介导。BAP1属于泛素羧基末端水解酶家族,在癌症的发生发展中有着重要作用,但其在
前列腺癌的早期诊断对于提高治疗成功率至关重要,临床主流诊断方法是穿刺活检。医学成像可以提高穿刺的精度和稳定性,经直肠超声(Transrectal Ultrasonography,TRUS)和磁共振成像(Magnetic Resonance Imaging,MRI)分别凭借良好的实时性和清晰的成像效果,成为前列腺介入诊疗中最常用的成像方式。但TRUS的成像效果差,难以准确定位病灶位置,MRI成像时间