【摘 要】
:
长链非编码RNA(long non-coding RNA,lncRNAs)是人体中非常重要的一类非编码RNA,它的长度超过200个核苷酸,在非编码RNA中占有极大的比例。近年来,越来越多的研究表明lncRNA参与众多的生物调控过程,基因调控的各个环节发挥了至关重要的作用。例如细胞的分裂分化、疾病的病理特征、免疫反应、细胞的代谢等等,与很多疾病的发生密切相关。目前lncRNA已经成为一些疾病诊断与治
论文部分内容阅读
长链非编码RNA(long non-coding RNA,lncRNAs)是人体中非常重要的一类非编码RNA,它的长度超过200个核苷酸,在非编码RNA中占有极大的比例。近年来,越来越多的研究表明lncRNA参与众多的生物调控过程,基因调控的各个环节发挥了至关重要的作用。例如细胞的分裂分化、疾病的病理特征、免疫反应、细胞的代谢等等,与很多疾病的发生密切相关。目前lncRNA已经成为一些疾病诊断与治疗的新的候选分子和靶标。探索lncRNA-疾病的关联,对于我们从分子层面上剖析疾病复杂的病理机制有着显著的作用,同时对疾病的前期诊断,中期治疗,后期护理和相关药物的研发都有着非常重要的指导意义。然而,通过常规的生物医学实验来探索lncRNA-疾病的关系耗时费力,代价很高。传统生物医学实验预测lncRNA与疾病关联耗时费力。面对众多未知功能和疾病关联的lncRNA,发展基于计算的方法快速有效地预测lncRNA与疾病的关联是非常有意义的。目前已有的方法主要包括矩阵分解以及网络表示学习,它们都面临着数据稀疏这一主要挑战。此外,目前已有的很多方法只考虑lncRNA和疾病浅层的特征之间的关联信息,而忽略了深层次潜在特征之间可能存在的联系。本文提出一种基于深度矩阵分解的lncRNA与疾病关联预测模型(DMFLD),该模型通过多头注意力机制、距离层网络、角度层网络以及深度神经网络形成了一个多维度知识汇集的融合模型,从而实现从多个维度来探索lncRNA与疾病之间隐含的潜在特征的高度非线性表示,进一步提高预测精度。主要工作包括以下几方面:1)为了解决高维关联矩阵数据的稀疏性问题,引入了词向量对lncRNA与疾病的关联矩阵分解,得到lncRNA与疾病的潜在因子(特征)。2)提出基于多头注意力机制自动构建潜在特征的因子分解机,该因子分解机能够自动构建关联度较高的潜在特征组合,从而充分捕捉lncRNA与疾病潜在高阶特征之间的内在联系。3)为了从空间的维度上来描述lncRNA与疾病的关联关系,构建了距离层和角度层网络。4)引入深度神经网络来学习lncRNA与疾病潜在特征的非线性表示,提高预测lncRNA与疾病关联的准确度。我们的方法无需大量有关相似度的额外计算,同时也使用小批次随机梯度下降的方式来解决时间复杂度过高的问题,提高训练速度。并且引入了正则化约束来解决过拟合问题。最后串联以上的深度神经网络、多头注意力网络、距离层网络和角度层网络通过多层感知机来得到预测结果。5)使用lncRNA-disease V2.0大规模数据集,大数据集可以发掘更有价值的结果,并且采用五个推荐系统中常用的指标:命中率(HR)、归一化折损累计增益(NDCG)、平均排名的倒数(MRR)、均方根误差(RMSE)以及平均绝对误差(MAE)。首先为了验证不同的矩阵分解模型对实验的影响,设计了全面的实验来比较不同的矩阵分解模型(Funk SVD、SVD++、NMF)对于实验结果的影响,以及对矩阵分解中的重要参数进行了系统的调参实验。然后,将我们提出的基于深度矩阵分解的计算方法与当前比较先进的方法以及传统的机器学习模型和深度学习框架进行比较。实验结果表明,深度矩阵分解的各项指标均优于其他方法。此外,研究案例表明我们提出的DMFLD能够较高精度地预测与三种疾病(肺癌,宫颈癌和结直肠癌)有关系的lncRNA。6)为了最大的方便相关研究人员的使用,我们开发了基于深度矩阵分解的lncRNA与疾病关联预测的web服务器(http://lddmf.natapp1.cc/)。
其他文献
目的:探讨早发型子痫前期(early-onset preeclampsia,eo PE)与晚发型子痫前期(late-onset preeclampsia,lo PE)患者外周血及胎盘滋养细胞线粒体融合蛋白2(mitofusin,Mfn2)的表达,初步确定该基因可能作为子痫前期的诊断和治疗靶点;探讨eo PE与lo PE两时期Mfn2的表达有无差异,为探讨两者之间发病机制提供实验数据。方法:1.收集
目的:比较腹腔镜下经自然腔道取标本与腹腔镜下小切口治疗结直肠癌的临床疗效差异,以期为临床结直肠癌手术方式的选择提供指导和依据。方法:选取2019年1月至2020年12月于吉林大学中日联谊医院胃肠结直肠肛门外科住院的确诊为结直肠癌且符合纳入标准的患者共57例。对57例患者资料进行回顾性分析,根据患者选择手术方式不同进行分组,其中NOSES组30名患者接受腹腔镜下经自然腔道取标本手术治疗,小切口组27
随着人工智能的快速发展,机器视觉技术在我们的生活和生产中应用的越来越广泛。针对盲人因视觉受限,难以及时、准确地感知周围环境的问题,本文提出利用机器视觉技术获取距离、目标信息的方法来便捷盲人的日常生活。本文将双目测距技术与目标检测技术相结合,可快速、准确地检测出盲人前方的物体种类,并计算出物体与盲人之间的距离。具体研究内容如下:一、研究相机成像原理及标定方法。首先确定了相机成像模型中的四个重要坐标系
目的:对比择期腹腔镜全子宫切除术患者应用羟考酮或舒芬太尼超前镇痛的效果。方法:选取吉林大学中日联谊医院2021年择期全麻下行腹腔镜全子宫切除术的患者60例,将60例患者随机分为羟考酮组(O组)、舒芬太尼组(S组),每组30例,术前评估患者情况。两组患者年龄30-60岁,体重指数(BMI)20-30kg/㎡,ASA分级I~II级,疼痛敏感性量表评分4-6分,手术时间、术中失血和病情等基本资料相仿。两
背景:胶质母细胞瘤是神经系统最常见的高度恶性胶质瘤,预后不良,经肿瘤手术、放疗、化疗等综合治疗后,平均生存时间仅为18个月,肿瘤的复发、耐药均是预后不良的主要原因,多药物、多治疗方案联合应用的管理方法可能成为延长胶质母细胞瘤患者生存期的有效手段。脂肪抑制素最早作为甾醇调节原件结合蛋白(SREBPs)的特异性抑制剂应用于研究代谢综合征,后被发现可通过依赖或不依赖SREBPs的途径抑制多种肿瘤。不依赖
我国地域辽阔,文化发展繁荣昌盛,独特的非物质文化遗产种类繁多。凤阳花鼓非遗文化在滁州旅游文化产业中,传承发展至今日,承载着人类的生活印记,是历史留给人们的宝贵财富,为设计文创产品提供了良好的客观条件及基础。本文开展凤阳花鼓视觉元素文创产品及包装设计的研究,探析文化创意产品及包装的开发设计实践。逐一概述凤阳花鼓非遗文化特色及形成原因,并详细介绍了凤阳花鼓非遗文化起源萌芽及发展融合,为凤阳花鼓非遗文化
背景及目的:胰十二指肠切除术(pancreaticoduodenectomy,PD)是在1935年由名叫Whipple的一名美国外科医生首先用来治疗壶腹周围癌的手术,因此又被称为Whipple手术。Whipple手术是治疗壶腹周围恶性肿瘤、癌前病变和部分良性疾病的标准术式,手术的操作相对来说很复杂,对病人机体的伤害比较大,并且术后可能出现的并发症比较多。微创外科蓬勃发展,腹腔镜下开展的PD在国际上
随着人机交互技术的进步和社会经济的发展,智能机器人在我们的日常生活中发挥着越来越重要的作用。其中可直接与人互动交流、服务于人类的语音机器人,更是走进了千家万户,它们被广泛应用于智能家居、智慧交通和智慧医疗等领域。对于一些特定的应用场景,比如家庭陪伴,要求语音机器人外观小巧精致,体积不能过大,还得具备一定的负重能力,保证机身内部能容纳下电机和电池等必要零件。由于机器人的外形壳体是内部空间的反映,在容
随着移动互联网的快速发展,众多自媒体APP喷涌而出,大大丰富了人们的生活,但与此同时也积累了海量的文本信息。自动文本摘要技术能从繁杂的文本中提取出主旨信息,过滤无关内容,提升人们的工作效率。目前,序列到序列(Seq2Seq)模型成为自动文本摘要技术中的主流研究方向之一。Seq2Seq模型由编码器和解码器两部分所构成,它能够灵活地处理输入输出数据,应用非常广泛。虽然Seq2Seq模型在文本摘要领域中
点击率预估是推荐系统和在线广告平台中一个关键的环节。作为直接影响公司营收、提升用户体验的关键技术,点击率预测问题一直是工业界和学术界研究的重点。近年来,人工智能技术在搜索引擎及视觉语音等众多领域中取得了突破性进展,各研究机构和互联网企业纷纷将相关技术应用于点击率预估问题,取得了许多出众的成果。本文通过分析经典点击率预估模型的结构特征和应用场景,发现在点击率预估问题中,主要存在两点挑战:其一,预估模