基于多组学数据的乳腺癌生存期预测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhut2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确的生存期预测可以有效地将乳腺癌患者区分到不同的危险程度组,一方面可以让患者获知该预后信息以便做出更好地生活安排,另一方面可以让医疗工作者对患者制定合理的治疗计划和医疗决策,使患者能够得到更为精准的治疗。目前,多组学数据由于新一代测序技术的发展数据量呈现出逐步增长的势态,在乳腺癌生存期预测研究中,整合多组学数据的信息以进而更好地预测乳腺癌患者的生存期,是现今仍待解决的重要问题。本文结合机器学习算法提出了一种预测乳腺癌患者生存期的方法,该方法利用包含甲基化、基因表达和拷贝数变异(CNV)的多组学数据获取患者的生存期标签。针对乳腺癌患者多组学数据的特征选择,本文提出了一种特征选择算法:REL1_FW,RE指二次,L1指基于L1正则化的逻辑回归(L1LR)算法,FW(feature weight)指特征权重。该方法的特点是使用二次L1LR算法进行高维多组学数据的特征选择,同时结合特征权重系数进行特征筛选。之所以进行二次特征筛选是因为多组学数据维度较高且组学数据之间存在冗余,具体做法是先对单组学数据进行L1LR特征选择得到单组学特征候选集,再在将单组学特征候选集拼接后的多组学数据集上再进行一次L1LR特征选择得到多组学特征候选集,FW指最后通过特征的权重系数排名按要求取排名靠前的特征作为多组学的最优特征子集。同时本文将L1LR算法与常用的四种特征选择算法做了比较,结果显示L1LR算法的准确率高,证实了REL1_FW的有效性。在对于特征选择后的多组学数据集,本文首先进行了五种常用分类算法的性能比较,实验结果表明性能最优的是支持向量机(SVM)算法,该算法有着高的准确率和良好的稳定性。本文联合REL1_FW特征选择算法和SVM分类算法对乳腺癌患者的生存期进行预测,实验结果表明预测准确率最高可达99.9%。
其他文献
车险目前乃至将来相当长一定时期内都是财险市场最大的险种,甚至中小财险公司车险的保费收入占比均高于七成,造成这一局面不仅是因为车险的覆盖范围大、人们认知度高且市场容
众所周知的是,无线视频组播数字传输方案会产生悬崖效应,为了更好地解决拥有不同信道特性的多个接收端接收到更优的视频质量,一种伪模拟视频传输系统Soft Cast被提出。MIMO技
城乡间发展差距是城乡关系研究的重要理论和实践问题,城乡间发展差距增大,不仅影响区域经济协调发展,影响生产要素的合理流动,也是产生社会矛盾的原因之一,并是影响2020年前国家实现全面脱贫的因素之一。本研究以新疆为案例,二元结构理论、城乡协调发展理论、城乡共生理论、城乡一体化发展理论为基础,采用协调度模型和熵值法、Arc GIS空间分析方法,构建城乡发展差距评价指标体系,对新疆2000年到2016年的
企业生产经营过程中产生的大量非结构化数据,尤其是文本数据中,蕴含着众多业务信息。如何充分利用这些数据,挖掘其中蕴含的价值并为决策提供指导成了人们关心的问题。文本的
《普通高中英语课程标准(2017年版)》将思维品质列为英语学科的关键能力之一,并强调英语阅读教学应以思维提升为导向。自课程改革以来,高中英语阅读教学虽取得了一定进展,但教学内容仍聚焦于文本的字面意义,教学活动以信息提取练习为主,没有很好地结合文本的体裁信息来培养学生分析、推理、评价等思维能力。体裁教学法为阅读教学提供了新的视角和理论依据。体裁被认为是一种交际事件,即作者因交际目的和对象的不同而采用
新疆阿克苏红富士苹果(Malus pumila‘Hongfushi’)具有果面光滑、果肉细腻、果香浓郁、果核透明的特点,富含丰富的维生素、纤维素等营养成分,素有“冰糖心”的美誉,其主产区
自1999年退耕还林政策实施以来,陕西省的生态状况逐年改善,沙尘暴天数减少,森林覆盖率提高,同时政府也投入了大量的人力物力财力对退耕还林成果进行维护。农户参与意愿是决定退耕还林政策绩效的关键因素。而随着城镇化和工业化的进程不断加快,农户对土地的依赖程度和对土地的要素投入度也出现了较大的差异,农户间逐渐发生分化,导致他们对退耕还林政策的参与规模意愿和管护意愿也出现差异。基于此背景,本文展开小农结构性
近年来,我国政府社会管理方式的改革给社区带来更多的自主权力,我国社区在高速发展中,出现了许多新型社区如企业集宿区,各种社区组织如雨后春笋一般地发展起来,在社区中发挥
无线传感器网络(wireless sensor networks,WSN)作为一种新兴技术,被广泛应用于军事监控、灾害预测、信息家电设备和建筑管理系统等社会领域中。由于无线传感器节点通常被部署于人类不便进入或无法踏足的区域中,因此如何降低节点能耗、延长电池更换周期是当前无线传感器网络研究的重点内容。分簇路由协议是提高能量利用率的一种有效手段,因此本文在无线传感器网络的相关理论基础上,对现有的路由协
水声通信技术在海洋观测、深海探测开发以及军用等方面都有着其重要的意义。由于水声信道是一个时间/频率双选择性衰落信道,码间干扰极大,对高速水声通信发展形成阻碍。现今