基于蛋白质质谱的肿瘤生物标记物选择与分类

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:awenqqw123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质组学质谱技术是目前广泛应用的蛋白质研究技术之一,特别是在癌症的早期诊断和生物标记物识别方面。该方法产生的海量质谱数据需进一步分析才能实现对蛋白质的定性和定量研究。因此,以生物信息学方法研究质谱数据已成为关键。通过分析比较病例组和对照组细胞组织中的蛋白质提取物,能够发现在疾病病理中起重要作用的异常生物标记物,从而正确的分类病例组和对照组。肿瘤蛋白质质谱数据具有样本小、维数高、噪音大、非线性等特点,挖掘可信的蛋白质生物标记物对肿瘤早期诊断与揭示发病机理等意义重大。首先,本文从纵向与横向两个方向综合考虑特征(峰度值)在病例组与对照组中的强度值差异,具体地,视数据集为两因素混合水平实验,其中A因素为样本标签(包括病例组与对照组两个水平),B因素为特征(m个特征即m水平),应用非平衡双向方差分析发展了一种新的高维特征选择方法:基于F测验的最高得分特征子集(Top Score Feature Subset based on F test, TSFS-F),并提出一种新的分类方法:基于F值的直接分类(Direct Inference Classifier based of F-test, DIC-F)。其次,为了评价本文方法的有效性,参比了2个特征选择方法SVM-MRMR和SVM-SVMRFE:其中MRMR和SVMRFE仅能获得特征的重要性排序,无法给出具体的特征子集,因此结合SVM对训练集做10-fold交叉测试,以特征重要性排序逐个引入特征,再取交叉测试精度最高对应的前若干个特征为特征子集。2个肿瘤蛋白质质谱数据的10次重复实验结果表明:1)TSFS-F所选最优特征子集特征数少而稳定;2)在KNN、NB、SVM三个分类器上的独立预测精度均优于参比特征选择方法,并有效改善了SVM分类器的过拟合,是一种鲁棒的高维特征选择新方法;3)DIC-F和三个参比分类器比较,分类精度虽稍弱于SVM,但和TSFS-F配合的分类精度均高于其他特征选择方法和分类器的组合。T SFS-F和DIC-F在复杂疾病生物标记选择与分类等高维特征选择领域有广泛应用前景。
其他文献
跨文化效力是指在跨文化沟通的过程中,达成工作任务或沟通目的的能力,属于跨文化交际能力的行为部分。教师教育者是高等师范院校中负责培养师范的教育工作者,是培养“未来教
空间在故事情节的发展过程中可以被看作一条重要的线索。本文通过对比发生在两组分别对立的地点里——仙后国和地狱,骄傲之宫和虔诚之宫——的主人公冒险经历,分析其分别代表
<正> 美国一向注意中才生的培养,比较忽视天才教育。1957年卫星冲击引起的危机感促使美国政府改弦更张,天才教育才渐入佳境。美国的实践表明,天才教育是培养尖端人才,加强国
建立和健全符合我国国情、适应市场规律的房地产市场调控长效机制,既是促使房地产市场平稳发展、保障全体人民住有所居的重要措施,也是新时代推进供给侧改革、促进经济结构转
文章利用多种计量方法综合测度中国股市泡沫的存在性问题,得到中国股市存在非理性泡沫的结论。首先,文章建立了一个包含市盈率、换手率、股票市值增长率/GDP增长率的参考指标
近年来,随着城市地铁建设如火如荼的开展,地铁竖井作为地铁施工过程中不可或缺的重要结构,得到广泛应用。地铁竖井马头门是城市地铁区间隧道与施工竖井连接的咽喉部位,由于地
教学“分数乘除法”这部分内容,我还是挺自信的,一是由于内容比较简单,二是这部分内容自己都教过好几届了。当我感觉良好地上完课后,却发现学生作业中的正确率不是太高。教学中,我
本研究采用跨文化效力量表和跨文化交际焦虑量表,调查了非英语专业大学生的跨文化效力和跨文化交际焦虑及其相关性。结果表明,中文版跨文化效力量表和跨文化交际焦虑量表具有
目的:1、观察和分析宫颈癌患者单纯放疗、同步放化疗、辅助化疗的临床治疗效果以及治疗相关副作用,以评估不同的治疗方案在临床应用中的价值。2、鉴于传统二维后装放疗无法个