【摘 要】
:
组蛋白去乙酰化酶1(HDAC1)属于组蛋白去乙酰化酶家族(HDACs)中的一员,是参与基因表达调控的重要酶,负责核心组蛋白去乙酰化。HDAC1异常表达与肿瘤的发生密切相关,是很有前途的癌症治疗靶点。本论文旨在收集大量HDAC1抑制剂,利用计算化学和机器学习的方法研究HDAC1抑制剂的结构与活性之间的关系,主要工作内容如下:(1)构建HDAC1抑制剂定性分类模型并对抑制剂结构进行聚类研究。建立了含有
论文部分内容阅读
组蛋白去乙酰化酶1(HDAC1)属于组蛋白去乙酰化酶家族(HDACs)中的一员,是参与基因表达调控的重要酶,负责核心组蛋白去乙酰化。HDAC1异常表达与肿瘤的发生密切相关,是很有前途的癌症治疗靶点。本论文旨在收集大量HDAC1抑制剂,利用计算化学和机器学习的方法研究HDAC1抑制剂的结构与活性之间的关系,主要工作内容如下:(1)构建HDAC1抑制剂定性分类模型并对抑制剂结构进行聚类研究。建立了含有7313个靶向人源HDAC1的具有生物活性抑制剂的数据集,并采用自组织网络(SOM)划分和随机划分方法将数据集划分成训练集和测试集。选用四种分子指纹描述符(MACCS、RDKit、topological torsions、ECFP4)用于表征抑制剂的结构,采用决策树(DT)、随机森林(RF)、支持向量机(SVM)、分布式梯度增强库(XGBoost)和深度神经网络(DNN)五种机器学习算法共构建了80个HDAC1抑制剂定性分类模型。由XGBoost算法构建的基于ECFP4指纹的模型Model 15A_2表现效果最好,在测试集上的预测准确率达到88.08%,马修斯相关系数(MCC)为0.76。通过决策树算法,分析了HDAC1抑制剂结构活性之间的关系。利用K-均值(K-means)聚类算法,将7313个HDAC1抑制剂划分成31个子类,发现其骨架主要分为五大类:(1)N-邻氨基苯基-苯甲酰胺类,(2)与中链烷基相连的异羟肟酸类,(3)芳基-N-羟基丙烯酰胺类,(4)芳基异羟肟酸类,(5)三氟甲基二恶唑类。且其中(1)、(2)、(3)、(5)四类结构与活性的高低有着显著的关系。芳香环并咪唑衍生物经常出现在高活性分子中。利用分子对接技术,通过HDAC1抑制剂与HDAC1活性位点的相互作用情况以及受体蛋白活性口袋特征解释了上述结构与活性之间的关系。(2)构建HDAC1抑制剂生物活性定量预测模型。建立了含有5050个HDAC1抑制剂数据集,其生物活性由荧光检测方法测得,并采用随机划分方法划分训练集和测试集。选用三种分子描述符(MOE、rdkit、CORINA)表征HDAC1抑制剂结构及理化性质。采用随机森林回归算法(RFR)、支持向量回归算法(SVR)和分布式梯度增强库回归算法(XGBoost)共构建了27个HDAC1抑制剂定量预测模型。由XGBoost算法构建的基于MOE描述符的模型27A_1表现效果最好,在测试集上的相关系数R~2为0.737,均方根误差RMSE值为0.579。XGBoost、RFR模型具有较好的鲁棒性,且XGBoost模型预测效果要明显优于SVR、RFR模型。通过对模型贡献较大的几个MOE描述符进行分析,发现分子中OH和NH的数量对HDAC1抑制剂定量预测模型十分重要,HDAC1抑制剂的范德华表面积、电荷分布、疏水性、氢键供体等性质对活性也有重要影响。本论文构建的多个HDAC1抑制剂分类及活性定量预测模型可作为虚拟筛选工具,对大型数据库中的化合物进行筛选,以便快速找到潜在的高活性HDAC1抑制剂。而利用QSAR模型探索得到的构效关系结论,可以为新型HDAC1抑制剂设计提供参考。
其他文献
小学科学作为基础课程对于小学生的成长成才具有重要意义,但当前我国小学科学教育还存在一些明显的问题,学校普遍不够重视科学课程、现有从事科学课的教师专业素养不高,多数学校缺少专业对口的教师,教学相关硬件设备不完善、教学方式僵硬刻板等问题,制约着小学科学教育的有效性,因此本文从提高对小学科学课程的重视度、加强小学科学的教师队伍建设、丰富实验设备,鼓励自制简易教具、丰富教学方式,转变教学观念等方面提出了相
"十三五"以来,中国经济从粗放式逐渐向集约型转变,各个产业也不断地转型升级以迎合新时代的发展趋势。其中,文化旅游业作为第三产业当中的新兴产业脱颖而出,成为又一个有力的经济增长点,在推进第三产业结构优化进程中发挥了重要作用。但由于文化旅游业存在发展时间短、发展不充分、结构冗余等问题,仍需进一步深化改革。在新冠疫情的冲击下,安徽省文化旅游业发展遭遇瓶颈,文化旅游中小微企业受到重创,但这同时也为文化旅游
课堂导入环节对提高课堂效率及效果有重要作用,是决定课堂成败的关键。精彩的课堂导入可以激发学生的学习兴趣,吸引学生注意力,在构建良好师生关系的基础上使学生主动进入到课堂学习氛围中来。文章从插画、活动、悬念及实验等几方面进行高中生物课堂导入环节的设计,为教师构建高效生物课堂奠定基础。
禾谷镰刀菌(Fusarium graminerium)引起的小麦赤霉病(Fusarium heat blight,FHB)是危害粮食产量和食品安全的一种全球性病害,危害面广且难以防控。目前小麦赤霉病防治十分困难,因此深入研究禾谷镰刀菌的致病机制对防控小麦赤霉病显得尤为重要。课题组前期研究发现,编码蛋白激酶A(PKA)调节亚基的Pkr缺失会造成禾谷镰刀菌在各生理过程出现严重缺陷。同时,pkr突变体不
研究背景与目的冠状动脉疾病是影响全球人口的主要心血管疾病之一。冠状动脉CT血管造影(CCTA)联合CT心肌灌注成像(CT-MPI)检查可以同时从解剖学及功能学两方面对冠状动脉及其支配的心肌进行综合评估。然而,CCTA联合CT-MPI在指导缺血性心脏病患者治疗方面的价值目前尚不清楚。本研究旨在评估CCTA联合CT-MPI“一站式”检查作为指导缺血性心脏病患者临床决策的有效性和安全性。材料与方法对前瞻
有研究者认为在抗日战争期间,国民党在正面战场作战,中国共产党在敌后战场作战。但事实上,一方面,中共也多次在正面战场作战,另一方面,中共在敌后战场也要与日军发生正面战斗,因此,对中共在抗日战争期间扮演的角色的定位,应当进一步科学化,即:在抗战期间中共虽然主要在敌后战场战斗,但中共不仅仅是在敌后作战,中共与日军发生了大规模的正面战斗,敌后战场不仅是对日作战的前沿阵地,而且是比正面战场更加前沿、更加接近
目的 分析就诊于义乌市几个哨点医院12岁以下儿童腹泻病例被诺如病毒感染的流行病学特征,为义乌市诺如病毒防控提供科学依据。方法 采用胶体金法检测2018年1月—2021年11月本院1 866例腹泻患者粪便样本中诺如病毒GⅠ、GⅡ基因型。结果 1 866份样本中,诺如病毒阳性率为15.81%(295/1 866),295份诺如病毒阳性样本中主要基因型是GⅡ,占比93.22%(275/295)。诺如病毒
农业始终是我国的立国之本,也是我国社会经济发展的重要支柱,要大力发展农业,首先农民需要掌握更多新的农业种植技术,才能更好地把技术应用于农业生产中,从而达到增产增收提升农民的经济收入,但目前农技推广过程中,农技培训仍然存在诸多问题,因此要针对农技培训中存在的问题进行分析优化,从而不断地提高农技培训的效果,更好地促进农业的生产。
<正>医疗技术的提高对医疗科学有积极影响,可推动医学技术不断发展。而医院开展新技术与新项目,则可提高医院的医疗技术水平与竞争力,但医院新技术和新项目存在较大的风险与高度复杂性。因此,医院必须加强新技术与新项目的管理,从项目提出到项目结束,都应该给予优质的管理方法,不断强化项目的立项、政策、目标、常态、风险、绩效、成果、经济管理。同时,在项目管理过程中,要凸显项目的创新型,提高对自主创新的重视,充分