【摘 要】
:
化学化工产品的使用和我们的日常生活息息相关。现如今,已登记生产和使用的化学品和化学品混合物已经超过35万种。这众多的化合物在其产品的整个生命周期都有可能暴露在环境之中,从而有可能对环境安全和人类造成威胁。生物降解性是化合物分子可以在生物的生命活动代谢过程中被分解利用从而从环境中去除;生物富集因子是在生物体内有机相中某种化学物质的平衡浓度与该化学物质在环境水相中的平衡浓度的比值,可以用来衡量生物从环
论文部分内容阅读
化学化工产品的使用和我们的日常生活息息相关。现如今,已登记生产和使用的化学品和化学品混合物已经超过35万种。这众多的化合物在其产品的整个生命周期都有可能暴露在环境之中,从而有可能对环境安全和人类造成威胁。生物降解性是化合物分子可以在生物的生命活动代谢过程中被分解利用从而从环境中去除;生物富集因子是在生物体内有机相中某种化学物质的平衡浓度与该化学物质在环境水相中的平衡浓度的比值,可以用来衡量生物从环境之中吸收并积累某种物质的程度。这两者都是化合物风险评估中必不可少的指标,而使用实验法测定,又难以对大量化合物进行管理,因此寻找高效有效的计算方法预测生物降解性及生物富集因子很有意义。随着计算技术的发展,同时人们已经通过传统的毒理学实验方法测试了大量的化合物,为计算机的数据分析提供了基础可靠的化合物结构数据和毒性数据。通过数学建模等计算机辅助手段,我们可以进行计算毒理学的研究,即探寻化合物分子结构与毒性之间的规律并进行计算机建模预测。本论文的主要工作如下:(1)构建了化合物生物降解性的定性分类模型。收集了1958个化合物生物降解性的数据。选用了CORINA理化性质描述符、MACCS子结构指纹描述符和ECFP4指纹描述符来对数据集中化合物进行分子表征。使用了支持向量机(SVM)、决策树(DT)、随机森林(RF)、深度神经网络(DNN)4种机器学习算法,以不同的算法和描述符组合总共构建了189个能够预测化合物生物降解性的计算机模型。其中使用MACCS指纹和DNN算法的模型Model D2表现最好,训练集预测准确率(Q)达到89.55%,马修斯相关系数(MCC)为0.76,而测试集Q=90.08%,MCC=0.77。通过定量构型关系分析,发现对于化合物的生物降解性来说,溶解度、分子的电负性、分子的电荷、分子的可旋转键数、分子的原子极化率、分子量等理化性质可能起到关键作用。化合物分子中芳香性的环结构以及氮和卤素原子都有碍于化合物的生物降解性,而酯基基团有益于化合物的生物降解。根据子结构片段在两类化合物出现的频率差值,找出了生物降解性化合物和难降解性化合物中的代表性子结构片段,这些子结构片段将对以后的化合物的风险评估起到一些警示性作用。(2)构建了预测化合物具体生物富集因子的回归模型。收集了1294个化合物在鱼类的生物富集因子数据,使用CORINA和RDKit两种分子描述符对具有实验生物富集因子数据库中的化合物进行表征。运用支持向量回归、随机森林回归算法与不同的描述符组合,构建了8批共400个预测模型。最终得到的8个模型在测试集的相关确定系数R~2基本都大于0.7,平均方误差MSE也小于0.6,这说明模型对于生物富集因子预测效果较好。其中最优模型Model F4(使用56个RDKit描述符和支持向量回归算法构建的模型)训练集R~2=0.9,MSE=0.19,测试集R~2=0.79,MSE=0.42,验证集R~2=0.73,MSE=0.52。通过定量构型关系分析,发现化合物的油水分配系数(log P)的特征权重高于其它的特征,说其对于化合物的生物富集因子影响至关重要。尝试只使用一个log P描述符对化合物的生物富集因子进行预测,发现模型效果并不好,说明只是油水分配系数并不能很好地表征化合物分子。同时也发现化合物分子直径和表面积大小对生物富集有重要影响,分子量小的化合物分子有利于生物吸收。本论文从计算预测的角度研究了化合物的生物降解性和分子结构之间的关系、化合物生物富集因子与分子结构之间的关系,构建了一系列可靠的计算机预测模型,通过分析模型的预测结果和模型所使用的描述符,探寻出了化合物分子本身结构与毒性间的一些规律。这些模型及结论可以为以后化学品的风险评估和数据管理提供一些参考。
其他文献
在过去的几十年里,癌细胞对化疗药物的耐药性不断增加,加上有害的副作用,增加了开发新的抗癌药物的紧迫性。与传统放化疗相比,基于多肽的肿瘤靶向治疗具有高特异性和低副作用等优点。为改善抗肿瘤多肽稳定性差的问题,同时提高其肿瘤靶向性,我们选择嵌合蛋白设计来实现这一目的。在本研究中,我们首先采用大环寡肽MCoTI-I作为嵌合多肽的载体。我们利用内含肽介导的蛋白质反式剪接技术在大肠杆菌中表达了天然胰蛋白酶抑制
转甲状腺素蛋白(TTR)的聚集与多种TTR淀粉样变(ATTR)疾病相关。然而,究竟是什么触发了TTR的初始病理聚集过程仍不清楚。越来越多的实验表明,与疾病相关的多种蛋白质在淀粉样纤维形成之前可能经历液液相分离(LLPS)和随后的液-固相转变。在体外,TTR四聚体通过ph介导的变性途径分解为错误折叠的单体并自组装成淀粉样原纤维。为了研究TTR病理聚集过程,本研究在酸性条件下探索其相分离和聚集行为。我
融合肉瘤蛋白(Fused in Sarcoma,FUS)是一种核RNA结合蛋白,在体外自发地形成相分离,并进一步凝结形成病理性纤维引发神经退行性疾病,如肌萎缩侧索硬化症。然而,有关于FUS这类可逆淀粉样纤维抑制剂的研究甚少,大多通过体内翻译后修饰干扰β结构的稳定性,从而调控FUS的动态组装。近年研究发现体内存在一种分子伴侣型蛋白抑制剂——肺表面活性蛋白C前体(Prosurfactant Prote
甲砜霉素胺是氟苯尼考与甲砜霉素等氯霉素类抗生素的重要中间体,其结构与氯霉素一样拥有两个相邻的手性中心。C-1与C-2的顺式氨基醇结构为其高效的工业合成带来了不小的困难。经过几十年的发展,各式不对称合成方法被相继开发出来,但大多由于各种原因而不适于工业应用。2014年Myers团队报道了一种使用Pseudoephenamine作为手性助剂介导顺式羟醛反应,用于胺基醇结构化合物的合成。Pseudoep
蛋白质的液液相分离(liquid-liquid phase separation,LLPS)被认为是将蛋白质和核酸等大分子组成无膜细胞器(如细胞质中的应激颗粒)的重要方式。当蛋白质的相分离过程发生异常时,会转变为不可逆的蛋白质聚集体,即淀粉样纤维。神经退行性疾病表现为选择性神经元群体不可逆转的进行性丧失,主要特点就是蛋白质聚集体在患者的大脑和脊髓中的积累,给有效治疗带来了比较大的困难。因此,抑制淀
<正>与西方电影一样,中国电影也起源于现代城市,并在城市里获得了充分发展,成为城市文化的重要组成部分。孙绍谊将研究对象聚焦于1927—1937年间体现上海时代特征的诸多方面,并在《想象的城市——文学、电影和视觉上海(1927—1937)》(以下简称《想象的城市》)一书中,通过文学、电影、建筑等多重话语构筑了上海的城市想象。在中国电影史上,意指20世纪二三十年代的“上海电影”构成了一个特定的电影文化
聚氨酯材料由于其在硬度、延伸率、强度和模量方面的优异性能,已广泛应用于生物医学应用、建筑和建筑应用、汽车、纺织等行业。为解决聚氨酯材料合成过程中大量使用石油基多元醇降解难度大,以及废弃生物质造成的环境污染和资源浪费的双重难题,本课题将废渣酒糟直接作为生物质多元醇,酒糟经过发酵,其分子量下降,反应活性提高,替代不可再生的石油基多元醇,成功合成出酒糟基聚氨酯薄膜和泡沫,并将酒糟基聚氨酯泡沫用作吸附材料
银屑病(Psoriasis),是一种慢性炎症性皮肤病。该病病因复杂、病情顽固、易复发。莱菔素(Sulforaphene,SFE),是从萝卜籽中提取的主要活性成分,具有多种药理学活性。研究发现,莱菔素可以抑制癌细胞的过度增殖和炎症反应,也可以调节体内的免疫反应和微环境,体内外实验都表现出稳定的抗癌活性。基于发病机制的相似性,我们推测,莱菔素也可以治疗银屑病。目前为止,莱菔素对银屑病的治疗效果和作用机
<正>时间状语从句是状语从句的一种,是高考的必考点。时间状语从句常见的引导词有:when, while,till, until, as, as soon as, before, after, since等。这些引导词明显具有时间属性。常见的特殊引导词有:the minute (一……就……), the moment (立刻,马上,一……就……), the second (马上,这一秒), the
膀胱癌是一种恶性肿瘤,2020年全球新发病例57.3万例,其中男性的发病率为女性发病率的5倍。膀胱癌现阶段临床的主要诊断方式是膀胱镜,主要治疗方式是手术治疗切除肿瘤,但超过50%的患者会复发,甚至在5年内的存活率只有25%。所以越来越多的研究者致力于研发膀胱癌新型有效的诊断和治疗策略。单克隆抗体(monoclonal antibody,m Ab)在肿瘤的诊断和治疗上,发挥着重要的作用。随着噬菌体抗