论文部分内容阅读
本文采用了基于人工智能网络的肽段保留时间预测方法,用以对蛋白质组学中的LC-MS实验结果进行训练与预测.该方法不仅考虑了肽段序列中氨基酸位置对保留时间的影响,同时还考虑到了肽段长度以及疏水性等性质,这些肽段性质可被用来提高保留时间预测的准确性.该人工智能网络采用了三层架构,其中输入层有652个节点,隐藏层有22个节点,以及输出层的1个节点.为了增加人工智能网络的训练可信度,同时减少不必要的拟合误差,本文选用了长度小于25个氨基酸的肽段作为训练集与测试集,同时样本都进行了一维色质联用的三次重复实验.该方法将人宫颈癌细胞样本中的8850条肽段作为训练集,最终得到的训练模型的决定系数为0.92.