基于深度度量学习的少样本基因表达谱癌症分类

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qixiannu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症已经成为全球范围内疾病和死亡的主要原因,对人们身体健康和生活都造成严重的影响。癌症产生的病因多种多样,找出癌症产生的原因和相关治疗方法成为科研工作人员的重要工作。经过科研工作者多年的研究,大多数包括癌症在内的疾病跟人类的基因相关,而人类研究自身基因的一个重要数据来源就是基因表达谱数据。基因表达数据是由生物学者选择一部分人体组织样本,加入指定试剂激活刺激组织内的基因表达,然后使用基因芯片去检测RNA蛋白质表达水平。一方面通过对某些患者及健康人士选取相同组织做基因表达谱数据,可以得到基因表达水平的不同;另一方面通过实验观测药物或者治疗方案对关键基因表达的作用,及观察前后表达水平差异,就可以评估治疗的作用和药物的疗效。因此使用基因表达谱数据对各类癌症进行细致分类,对于癌症诊断治疗有着极其重要的作用。然而在一个基因表达谱数据集中,通常只有几十个样本,而一个样本检测的基因数目高达数万,特征维度和样本数量不均衡导致基因表达谱数据直接使用机器学习模型分类时存在严重的过拟合问题。在生物信息领域使用深度学习来分析基因表达谱数据已经是一个非常重要的应用了。现有的深度学习方法已经在基于大型基因表达谱数据的癌症诊断方面取得了成功。然而,之前的深度学习模型在高维度少样本的基因表达谱数据上难以取得令人满意的表现。本文提出了一种基于深度度量学习的少样本基因表达谱数据癌症分类的方法——Deep Metric Learning with Sparse Feature Selection(DMSFS)。DMSFS通过针对基因表达谱数据高维度少样本的特点,设计基于深度度量学习的样本生成层来生成更多的新样本,从而解决样本数量和特征维度不均衡的问题。同时,DMSFS中设计了新型的基于梯度下降的特征权重层,通过模型训练中特征权重的变化幅度体现特征的重要性。将特征权重排序后,DMSFS从高维度的特征中选择重要的特征参与分类器的训练,从而减少参与训练的特征数量。DMSFS中的两个网络连接后,一方面通过样本生成层生成更多的样本促进特征权重层更好地选择重要特征,另一方面特征权重层选择更重要的特征促进模型判断样本之间差异性,从而反馈给生成层生成更适合挖掘差异性的新样本。DMSFS在与当前五个具有代表性的方法对比时,在8个真实的基因表达谱数据上实验结果取得了10至5个百分点的提高。
其他文献
将1.5维谱分析和Teager能量算子相结合,提出了1.5维能量谱的分析方法,并针对滚动轴承故障诊断问题,从提高故障信号信噪比的角度出发,提出基于EEMD降噪和1.5维能量谱的故障诊
随着社会信息化、智能化和数字化迅猛发展,社会网络舆情事件突发频发,教育作为最大民生,成为整个网络舆情的活跃点和敏感带,对教育行政管理部门带来新挑战和新要求。其中舆情
教师的专业化水平对教育质量有着决定性作用,而教师培训是实现教师专业化的主要手段之一。培训模式作为培训组织、实施的形式体现,对培训质量起着重要作用。而当前教师培训模
以2,2-双[4-(4-氨基苯氧基)苯基]丙烷(BAPP)和4,4′-二氨基二苯甲烷(MDA)作为二胺单体,3,3′,4,4′-二苯酮四酸二酐(BTDA)作为二酐单体,N-甲基砒咯烷酮(NMP)为溶剂,通过常规
暖通工程是现代人们居住建筑的重要组成部分。随着人们生活水平的不断提高,人们对居住的环境和施工质量要求越来越高。暖通工程给人们的生活提供了保暖和通风的需求,是人们生
介绍了交联聚乙烯(PE—X)及其管材的交联机理和产品特点。比较了过氧化物PE—X管、硅烷PE—X管、辐照PE—X管的生产工艺和产品优缺点。综述了PE—X管国内外近几年的发展、市场
近年来,毫米波通信与检测系统得到了长足发展,并随着毫米波宽带器件的应用,低噪放作为系统中的关键器件,毫米波系统中的宽带低噪放得到了广泛研究。随着CMOS工艺的不断改进,
环境问题和能源危机变得越来越严重,而通过光催化方法来降解污染物和制氢是一种很好的设想。充分利用可再生的太阳能来解决环境问题和能源危机已经成为全世界的研究热点。半
研究背景:酒精性肝病是酒精过度消耗所引起的肝脏一系列表现,其疾病谱包括脂肪变性、脂肪性肝炎、进展性肝纤维化和肝硬化。慢加急性肝衰竭是酒精性肝病的严重类型,4周死亡率超过15%,高达40%。结合EASL的ACLF诊断标准,以28天病死率及疾病进展率为依据,代偿性酒精肝发生急性肝损伤/急性失代偿有望被分为急性肝损伤/急性失代偿期和慢加急性肝衰竭期,后者又根据器官衰竭的个数分为1、2、3级。通过大样本队
蛋白质磷酸化是生物体内最重要的一种翻译后修饰,磷酸化反应是由蛋白激酶将ATP上的磷酸基团转移到底物特定氨基酸上完成的。磷酸化是一种可逆的共价修饰,其逆过程被称为去磷