【摘 要】
:
癌症是一种全球性的致命的疾病,近几年癌症发病率急剧上升,中国面临的问题更加突出。随着计算机科学和机器学习技术的迅速发展,计算机辅助癌症检测起到了越来越重要的作用。
论文部分内容阅读
癌症是一种全球性的致命的疾病,近几年癌症发病率急剧上升,中国面临的问题更加突出。随着计算机科学和机器学习技术的迅速发展,计算机辅助癌症检测起到了越来越重要的作用。近年来,基因测序技术也取得了重大的突破,人们已经取得了越来越多的癌症组学数据。利用机器学习方法挖掘组学数据中的重要信息,研究各种类型的组学数据与癌症发生和发展的关系成为当今的研究热点。本文从RNASeq数据和DNA甲基化数据入手,旨在探索机器学习和深度学习方法在癌症组学数据分类问题中的应用。针对RNA-Seq数据,本文通过搭建深度卷积神经网络,进行癌症诊断研究与癌症类型预测,并在乳腺癌、胃癌、肺腺癌三个癌症数据集上对设计的模型进行验证。实验结果表明,相比传统机器学习方法,基于深度卷积神经网络的预测模型能够通过多层的非线性变换提取出更加抽象的特征,在癌症基因表达数据分类任务上取得了更加准确的预测效果,准确率和召回率均有提升。对于DNA甲基化数据,虽然深度卷积神经网络在特征提取上有优势,但是由于临床癌症甲基化数据集样本特征维度高、样本数目较少,直接设计大规模的卷积神经网络容易过拟合。对此,本文搭建了一个融合浅层机器学习方法与卷积神经网络的模型对DNA甲基化数据进行预测,并在肺腺癌、肝细胞癌、肾透明细胞癌三个癌症数据集上进行癌症类型预测与癌症诊断研究。实验结果表明利用机器学习方法能有效挖掘DNA甲基化数据与癌症发生发展的关联,而融合浅层机器学习方法与卷积神经网络的模型克服了传统机器学习方法分类性能不佳和深度卷积神经网络对训练样本需求量大的问题,结合了两者的优势,在DNA甲基化数据分类任务上取得了更好的结果,多项性能指标均有提升。简言之,本文的实验结果表明利用机器学习和深度学习的方法能有效的挖掘RNA-Seq和DNA甲基化数据与癌症发生的关联,为癌症的诊断提供了新的思路。
其他文献
当今世界威胁人类生命健康的重大疾病主要包括恶性肿瘤、感染性疾病、心脑血管疾病等,本论文主要研究的是白血病和革兰阴性杆菌相关感染性疾病这两种重大疾病,以此希望提高人
谷丙转氨酶2(Glutamic-pyruvic transaminase,GPT2)是一种催化可逆反应的谷丙转氨酶,在谷氨酰胺代谢和三羧酸循环(Tricarboxylic acid cycle,TCA cycle)中发挥着重要功能。目前关于GPT2的研究主要集中在谷氨酰胺代谢和神经发育疾病上。最近有文献报道,多数肿瘤中GPT2表达上调,并且与肿瘤的发生发展密切相关。但是,GPT2的表达水平对肿瘤,
PPP(Public-Private Partnerships),作为公共产品和服务供给机制的重要突破,是西方国家政府治理改革创新中呈现的一个新理念。目前,采取PPP模式进行公共设施项目建设在世界各
建筑业是我国改革开放以来的支柱产业。近年来,伴随着我国房市经济的上升,建筑业壮大的速度不断加快,但经济上行的势头下隐藏着施工质量隐患。因此如何保证既让施工项目达到高质量要求的同时又提高经济效益成为困扰国内外建筑研究学者及行业专家的难题。由于我国建筑施工质量事故频发,给社会和个人不仅造成经济上的损失,还严重危机到人民生命安全。是国家和政府密切关注的热点问题。为此我国中央、地方政府和建筑施工单位都制定
线粒体天冬氨酸-谷氨酸转运蛋白SLC25A12和SLC25A13是构成线粒体苹果酸穿梭系统的重要元件,完成细胞基质中NADH向线粒体基质的转移,从而调节细胞内NADH水平。氧化型NAD~+作为
随着我国经济和社会的持续发展,在经济发展水平以及生活质量不断提高的同时,我国环境污染的问题也变得越来越突出——今年以来京津冀地区日趋严重的雾霾以及全国各地大范围水
波纹钢管廊相比传统钢筋混凝土管廊有较强的抗弯能力、抗拉能力及可适应不同地基能力等众多优点,已广泛应用于国内外管道和涵洞工程、运输工程和仓储工程。目前,国内外大多数学者主要针对波纹钢管廊的整体受力及具体构造进行研究分析,对波纹钢板高强度螺栓连接纵向接缝的受力性能研究较少,并且现行规范中连接极限承载力多以具体构造列表给出,不便于工程设计。因此本文对波纹板连接件进行试验研究及有限元分析,提出波纹板纵向接
第一部分:组蛋白H3K14M突变抑制嗜肺军团菌来源甲基转移酶活性目的:嗜肺军团菌编码表达具有组蛋白甲基转移酶活性的RomA,通过催化细胞中组蛋白的H3K14甲基化(H3K14me)干扰宿主细胞的表观遗传调控,利于自身的复制和增殖。近期研究发现组蛋白H3的K-to-M突变能够显著抑制对应的甲基转移酶的活性,因此本研究探讨真核宿主细胞中组蛋白H3上14位赖氨酸突变为甲硫氨酸(H3K14M)突变对嗜肺军
自20世纪90年代以来,中国的城镇化进程迅速发展。2014年3月,《国家新型城镇化规划(2014年-2020年)》发布;9月,国务院召开了试点建设新型城镇化的工作会议,自此新型城镇化被推
黑素瘤是一种具有高死亡率和高转移率的黑色素细胞恶性肿瘤。循环肿瘤细胞(Circulating tumor cells,CTCs)是判断癌症转移、复发和治疗效果的标志,考虑到黑色素瘤细胞具有很