论文部分内容阅读
抗微生物肽(Antimicrobial Peptides,AMPs)是生物体自身产生的防御入侵病原体感染的小分子多肽,是生物先天免疫防卫系统的一个重要组成部分,对大多数的病原体有效且不易产生抗药性。抗癌肽(Anticancer Peptides,ACPs)是一种具有明显抗肿瘤活性的抗微生物肽,通过溶膜和非溶膜两种作用方式来抑杀肿瘤细胞。抗微生物肽的研究对于开发新药物有着重要的意义,而采用有效的方法来预测抗微生物肽及其生物学功能也成为了科学家们研究的热点问题。 本文选取了已发表文献中的抗微生物肽和抗癌肽两个数据集,通过选取多种特征向量信息,采用支持向量机(SVM)算法、随机森林(RF)算法和加权K-近邻(WKNN)算法,在5-折交叉验证下进行了预测。在研究中,当采用氨基酸组分信息(AAC)和伪氨基酸组分信息(PseAAC)时,预测效果较好。在对抗微生物肽的预测中,选取氨基酸组分信息为特征向量,输入随机森林分类器,总体准确率最高达到90.83%,比目前国际上选用相同数据库的最优结果高4.51个百分点。在对抗癌肽的预测中,选取氨基酸组分信息与伪氨基酸组分信息的组合向量为特征信息,输入支持向量机,总体准确率最高达到93.31%,高于国际上使用相同数据库的最优结果3.61个百分点。由结果可见,本文中的方法可以有效的对抗微生物肽及抗癌肽进行预测。