蛋白质质谱数据分析模型及其应用

来源 :浙江理工大学 | 被引量 : 2次 | 上传用户:ahehehehehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是一类由控制细胞分类和凋亡的机制失常而导致的疾病。预防癌症致死的关键是提高癌症的早期诊断水平,而在癌症的早期诊断和治疗中,最主要的是找到肿瘤的潜在生物标记,蛋白质组学的发展为癌症的早期检测和诊断提供了可能,其中基于质谱技术的蛋白质组学数据分析能为肿瘤的早期诊断提供有力手段。从高维的肿瘤蛋白质质谱原始数据中挖掘出具有样本差异的标记物或者找出可以体现样本之间差异的特征,对识别恶性肿瘤的生物标记具有非常重要的意义。本文针对低样本、维数高的质谱数据,采用有效的降维方法,提取对分类预测具有高可靠性的质谱数据。按照其谱丰度的大小将其转化为蛋白质序列。利用蛋白质质谱数据准星形图的构造,提出了用两类准星形图的拓扑指数来数值刻画蛋白质质谱数据的数字特征,建立蛋白质谱的数学刻画模型。进一步地,根据得到的拓扑指数利用SVM构建二分类模型。首先应用不同的归一化方法对数据进行标准化,利用不同的SVM核函数进行分类,结果显示在[0,1]归一化时选取高斯核函数分类,对数据进行[-1,1]归一化时选取线性核函数分类,分类预测的准确率均为97.67%,敏感性为98.75%,特异性为96.00%。与其它方法相比较,此方法具有较高的准确率。最后将此方法推广到三分类数据集上,构造SVM三分类分类器,正确率为64.8%。本文的方法具有很好的拓展性,可拓展到对其它二分类数据的分析。
其他文献
我国企业内部审计从发展之初即被高度重视,在政府的大力推动下,经过二十多年的发展,虽然取得较大进展,但离发达国家的水平仍有很大差距。本文围绕我国政府推动模式的内部审计
当前幼儿园多媒体教学存在教学主题被冲淡、重点不突出、忽视传统教学、交互性少等问题,解决这些问题可从多媒体课件设计应遵循的原则、将多媒体课件有机地融入传统教学、精
中国的土地市场自从建立以来,短短二十几年的时间经历了探索阶段、发展阶段,现在处于理性推进阶段。这个过程是土地制度改革的过程:国有土地从无偿、无限期、无流动的使用发展
意境作为我国古代美学和文论的一个具有丰富内涵的概念和范畴,对它的解说历来纷纭复杂。我国著名文学家茅盾在全国文学翻译工作会议上给文学翻译下的定义中也提到了意境,他说
互联网的发展为市场营销的发展创造了契机,网络营销逐步发展起来。网络营销作为一种全新的营销方式,与传统营销方式相比具有一定的优势,是企业取得竞争优势的重要武器。本文
目的:观察青鹏膏剂对豚鼠瘙痒及湿疹模型的影响。方法:豚鼠用磷酸组织胺致痒,观察青鹏膏剂0.48,0.24,0.12 g.kg-1经皮给药3 d后的豚鼠各给药组的致痒阈;造成豚鼠湿疹模型,青
不同皮肤腺的分泌物以及身体不同部位湿度和氧浓度决定了皮肤细菌群落 ,不同种类及密度的细菌和皮肤分泌物的相互作用产生不同气味。人体可产生复杂的化学气味 ,产生的部位通
旅游服务贸易是现代国际服务贸易的重要组成部分,它已经成为东盟国家重要的经济支柱,在中国与东盟的服务贸易中更是占据接近"半壁江山"的地位[1]。文章围绕中国—东盟旅游服
对柴胡和白芍的抗抑郁方面的相关研究进行文献整理和分析。检索的数据库为中国知网(CNKI),以柴胡、白芍、抗抑郁为主题词检索1988年—2012年的相关文献,筛选整理后按照化学组
一种二乙基次磷酸钠的制备方法,用次磷酸钠与烯烃在有机溶剂和水的混合溶剂中在自由基引发剂作用下制备二乙基次磷酸钠。反应过程中不需酸性条件。这使得二烷基次磷酸钠的合