基因芯片数据处理方法及在乳腺癌数据中的应用

来源 :清华大学 | 被引量 : 0次 | 上传用户:MyEclipse927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片是二十世纪九十年代新兴的一项实验技术,它不同于传统的生物实验手段,可以同时检测成千上万个基因的表达情况。由于其研究的问题规模较大,传统的生物学数据分析方法并不能很好的处理这类数据。伴随着基因芯片技术的不断发展,其数据分析方法也在不断的发展。本文首先从芯片数据分析流程中探针匹配、野值检测、特征选择和构建调控网络环节中存在的问题出发,通过提出新方法或系统的研究来解决这些问题,最后通过对一个乳腺癌数据进行分析来阐释基因芯片在生物学研究中的作用与不足。针对探针匹配问题,我们通过比较一系列数据分析方法在基于新旧探针组定义生成的数据集上得到的结果来研究探针匹配问题对数据分析的影响。经过比较后我们发现改变后的定义对基于基因和基因集合的分析影响很大,对样本分析的影响很小;在野值检测这一环节,我们提出了一套基于迭代思想的野值检测策略,该策略不仅原理简单,不受分类方法局限,而且还在仿真和实际数据集上都取得了令人满意的结果;针对wrapper类方法无法计算每个特征统计显著性的问题,我们提出一套基于排序值衡量特征统计显著性的方法,在仿真数据集上得到的实验结果证明了该方法的有效性;在构建调控网络的研究中,我们通过改变贝叶斯网络学习过程中的参数来研究参数选择对基因调控网络重建结果的影响,比较结果表明先验知识和初始结构都会对网络重建的结果有着不可忽略的影响,在具体使用时应根据实际情况加以选择。在乳腺癌数据的分析中,我们分别研究了基因表达与乳腺癌病人临床特征之间的关系,这些临床特征包括激素受体、淋巴结扩散、肿瘤分级、LVI和肿瘤大小。实验结果表明:激素受体、肿瘤分级这类生物学特征与基因表达之间有很强的相关性,可以从基因表达进行预测;而淋巴结扩散、LVI和肿瘤大小这类解剖学特征则很难从基因表达进行预测。针对与病人预后十分相关的淋巴结扩散问题,我们还研究了其与临床特征间的关系,并分析了各种与其相关的特征对淋巴结扩散的影响。
其他文献
目的:分析红皮病的病因、诱因、临床特点、治疗方法及疗效。方法:回顾性分析2017年1月至2019年1月我院165例红皮病患者的临床资料。结果:165例患者中,男116例,女49例,男女比
校园文化建设是一个学校教师、学生精神面貌,思维方式,价值观和行为准则的综合体现,是提升教育内涵,促进教育健康发展的重要途径。为进一步提高办学质量,提升办学理念,我们应
目的:探讨寻常型银屑病(PV)患者体内半乳糖凝集素(Gal)家族蛋白表达情况。方法:采用ELISA法检测30例PV患者与30例正常对照者血清中Gal-1、Gal-3、Gal-7、Gal-9的水平;采用免
光参量振荡器是产生宽带连续可调谐的中红外激光的一种非常重要的手段,它能够将一个泵浦激光转换为相干输出的信号光和闲频光,且可以在较宽的频率范围内实现连续可调谐输出。另
目的:探讨球形马拉色菌过增殖小鼠特应性皮炎(AD)模型的建立方法。方法:将18只BALB/c小鼠随机分为6组:对照组、AD组、NS/M组、AD+NS/M组、Oil/M组和AD+Oil/M组,每组3只。通过
目的:探讨CO2点阵激光联合糠酸莫米松乳膏治疗慢性湿疹的临床疗效。方法:将60例慢性湿疹患者随机分为治疗组及对照组,各30例,治疗组给予CO2点阵激光治疗,间隔2周治疗一次,共3
汉代辞赋家和儒士经生的家族兴衰之叹,主要是针对自己家族的历史而发,这和《史记》、《汉书》的侧重点有所不同。扬雄、杜笃都有家族兴衰的切身体验,但辞赋中没有明显地表露出来
文稿所涉及的课题如为国家级、部级、省级等基金资助项目,请分别用中英文表述并分别列于文章中英文摘要关键词之下,“基金项目:”进行标识,并注明基金项目名称,并在圆括号内
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>随着计算机技术的飞速发展,网络信息已经渗透到社会发展的各个领域,信息网络已经成为社会发展的重要保证。随之而来的网络信息安全,也成为了全球的热点问题。网络信息安