基于图表达蛋白质组学质谱模式的癌症诊断可视化方法研究

被引量 : 0次 | 上传用户:ZWCSS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表面加强激光解析电离飞行时间质谱(SELDI-TOF MS)结合生物信息学方法进行检测与分析,能够发现癌症“指纹”进而建立诊断模型,有助于增加对健康与疾病状态差别的理解,提早识别危险因素,从而提升疾病诊断的能力。然而,目前对于在癌症诊断中质谱数据应该如何处理还没有一致意见。蛋白质组学质谱数据处理问题成为国际上关于蛋白质组学在癌症诊断实验室研究和临床应用研究最急迫需要研究的热点问题之一。本文针对蛋白质组学质谱数据分析中统计学算法的实现过于复杂、对于实际问题领域专家较难理解的问题,基于可视化数据处理思想,研究蛋白质组学质谱数据分析中的三项基本问题:质谱数据的合理预处理;质谱数据的特征设计与选择;基于复合生物标记物的分类器设计与评价。从而使数据表示可视化、特征提取可视化、分类过程可视化。有利于医学专家和生物学专家挖掘和发现蛋白质组学质谱数据中隐含的丰富知识。首先研究了旨在减小系统误差、改善数据品质、增强数据可解释性的蛋白质组学质谱数据典型预处理方法,包括数据简约、谱线平滑、基线校正、标准化、谱峰提取与量化、谱峰联配等,确定了本文所研究数据集的预处理流程为小波降噪→基线校正→峰值提取→峰值配准。然后研究了两种癌症“指纹”提取方法:局部区域多元信息的雷达图表示与图形特征提取;全样本/均谱断层成像特征选择。图形特征提取是在建立高维数据与多元图表示映射数学模型的基础上,基于局部信息最大化的学术思想,实现质谱指纹数据与多元图表示之间的耦合,在特征选取与降维的同时最大化利用质谱数据的多元信息。图像特征选择是以数据全样本排列或均值行列/卷绕排列生成数据立方体,对维切片断层图像二值化并计算能量曲线,选择最能区分癌症组和控制组的质谱指纹特征。最后研究了基于径向坐标映射结合机器学习算法实现可视化分类的问题。对二维径向坐标映射模型优化后,与支持向量机分类器有机结合,直观地揭示高维数据集中类别和特征间的关系。通过图形特征将二维径向坐标映射扩展到三维,更有效的显示类内及类间相似度的信息,并可以发现隐含的子类。以多元图表示作为数据、专家、机器信息交互和流动的载体,实现基于复合特征的癌症模式分类。基于国际公开蛋白质组学质谱数据库数据,根据多种评价指标验证了所提出的蛋白质组学质谱指纹癌症诊断生物标记物模型和方法的正确性、有效性。
其他文献
为促进经济发展和落实高等教育国际化战略,新加坡政府于2002年提出"环球校园"计划。在"环球校园"计划实施临近尾声之际,通过对该计划的出台背景、主要内容和实际成效进行介绍
《还乡》与《平凡的世界》是哈代与路遥笔下两部散发着悲剧色彩的经典小说,讲叙了两个感人至深的悲剧。本文以悲剧世界为中心对两部作品进行平行研究,通过对两部小说中男主人
目前,我国北方村镇供热采暖以分散式为主,不但会造成环境污染,而且能源利用效率低。因此,基于我国北方采暖地区太阳能丰富以及村镇生物质能源无需运输等特点,研发清洁的生物质锅炉
综述了轮胎分析理论的发展与内容 ,介绍了有限元理论在轮胎结构设计中的进展。文中着重介绍了有限元分析技术在轮胎接触以及轮胎在稳态与动态下温度场分布问题上的应用。
目的:观察中药湿敷方在产后会阴侧切、直切分娩的产妇会阴切口肿胀、疼痛中的效果。方法:选取经阴道分娩会阴侧切、直切的产妇200例,随机分为两组,每组各100例,其中治疗组予
高中地理课程是能够培养学生综合素质的一门课程,对于理科生来说虽然不是主要课程,但是对于促进学生全面发展具有重大意义。在学习地理课程时,掌握了读图的能力就等于掌握了
本文通过查阅国内外文献并进行分析和归纳,对近年来麦冬皂苷的药理活性研究进行综述,主要包括对心血管系统的作用、抗血栓、抗肿瘤、抗炎、祛痰等作用,为该药物进一步的开发
金属的塑性指标通常与变形体的体积大小(或几何尺寸)有关,即存在所谓“体积效应”。例如,一些研究表明,在一定范围内,变形体的体积越大,材料宏观的塑性表现越低;而当体积达到某一临界
2006年,我国提出要实行事业单位绩效工资改革;2009年,国务院提出进行事业单位绩效工资改革的三个步骤;2011年,国务院又提出要实施事业单位分类改革,在此背景下,作者将关注的焦点放到
"被XX"是时下新闻媒介非常流行的语言现象,文章从认知语言学的角度对"被XX"结构进行研究,探讨了"被"字的属性、构式的理据、事件凸显性等问题,发现"被XX"结构是一种标记性构