基于网络表征学习的生物网络节点分类

来源 :厦门大学 | 被引量 : 0次 | 上传用户:loakl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组测序完成,“后基因时代”就此开启,科学界对于生命功能的探索重点逐渐从对单一的目标分析转移到组学分析。对组学进行分析时,主要是利用了已经积累的大量的生物组学数据并且与计算机技术相结合来从系统的角度进行分析,这大大提高了研究的效率。同时,计算机技术可以对生命过程进行建模,基于模型和大量的数据来对生物实验进行指导,提高生物实验的效率。生物信息学作为一个交叉性的学科,它将生命科学与计算机科学相结合,对未来的生物研究提出新的思路。生物信息学强调从系统角度出发,从系统层面去发现和解释相关的生命机制,这也是未来研究的必然趋势。本文中针对生物网络中的节点分类进行研究,对节点进行分类有利于我们挖掘节点在网络中的作用以此来推断它们在生命活动中的作用,除此之外,节点分类也可以对未知的节点进行来推断这些还未知的节点的功能,这对下一步的生物实验具有指导意义。节点的分类主要根据节点在网络中的重要性,以及节点在网络中的分布情况这两种不同的角度来进行表征学习继而进行节点分类。在本文中主要完成以下两个方面的工作:1)在基因网络中进行节点分类。基因之间通过相互作用来共同合作完成生命功能,这种相互作用的关系形成了基因网络。通过对基因网络中的基因进行分类有利于帮助我们理解基因在生命活动中承担的作用以及基因的重要性。在实验中我们把结构洞理论把信息流动的思想引入到基因网络中,并以此为根据来进行网络表征学习,通过表征学习的结果对节点进行分类。对不同类别的节点我们进行了分析,验证了不同类别的基因在生命活动中起到了不同的作用。2)我们设计了一个新的基于GAN的网络表征学习算法WalkGAN。将这个算法用到了疾病-基因网络中,通过表征学习的结果对节点进行分类。我们将我们的方法与一些经典的网络表征学习算法进行比较,实验结果证明我们的算法得到的表征学习的效果要优于其他的算法。
其他文献
辣椒是绥化地区主栽的经济作物之一,化肥和农药在辣椒生产中发挥了重要作用。然而在辣椒的栽培过程中由于化肥和农药的不合理应用,常造成土壤板结、土质酸化、作物产量低、品质差以及农药残留、病原菌产生抗药性等诸多问题。辣椒疫病为辣椒栽培中常发病害,发病严重时可减产50%以上,常给生产造成严重损失。本研究以黑龙江省绥化市北林区鑫诺瓜菜种植合作社为试验基地,在检测土壤中残留硝态氮含量的基础上,通过引入日本缓释肥
目前我国不同地区之间的经济水平的差异性直接影响了当地的医疗水平和居民的健康意识。对于我国当前的国情来说,难以保证有足够的专业人员、时间和精力等来进行医疗健康信息的面对面咨询交流,尤其是对于普遍性的、简单易懂、易获得、有明确的使用规范的健康信息的咨询。另一方面医疗健康信息的分散性、变动性、无序性、多样性、异构性,也增加了用户对信息搜寻、获取、交流的难度。因此,对医疗健康信息进行有效的控制、组织、规范
滨五块于1987年正式开发,至今有28年开发历史,随着注水开发时间的延长,由于合采合注井较多,层系细分不彻底,再加上后期井网不完善,开发效果逐年变差,制约了油藏采收率进一步
分蘖洋葱抗逆性强、生育期短、高产、供应期长、营养丰富、风味独特,越来越受到人们的重视。但目前对于分蘖洋葱优良品种的鉴定及筛选的报道不多,品种的系统分类研究较少,不同品种基本特性不明确,不利于分蘖洋葱的推广和应用。本研究以69份不同地区来源的分蘖洋葱种质资源为材料,在田间同一条件下种植来观测各种质资源农艺性状的差异,并测定各种质资源分蘖洋葱的基础营养品质指标进行品质分析,对69种分蘖洋葱种质资源进行
为临床血栓性疾病的早期诊断研制一种操作简单快速、准确性高、特异性强的抗凝血酶Ⅲ(AT-Ⅲ)测定试剂盒,在临床应用中能够实现进口替代,降低临床检测费用,减轻患者医疗成本。
在寻找绿色能源和可再生能源的进程中,人们认为将水分解为氢和氧是理想的策略之一。与质子还原反应相比,水氧化反应(2H2O→O2+4e-+4H+)由于多质子耦合电子转移和O-O键的形成需
高效选择性光氧化是一种获得复杂有机氧化产物的简单途径,可有效将太阳能转化为化学能进行储存,为实现能源的可持续利用提供了支撑。在光氧化领域,高效利用太阳能的关键之一
番茄(Lycopersicon esculentum Mill)是全球栽培面积广、消费量大的蔬菜作物,中国是世界最大的番茄生产和消费国家;北方高寒地区4月~10月是番茄栽培的主要季节,近年来大棚番茄越夏栽培成为重要茬口;在种植过程中,由于番茄生长周期较长,盲目、过量施肥的现象非常普遍,且普通化肥施用量过大,追肥次数较多,化肥利用率低,极大地浪费了人力物力,相应的夏秋番茄产品的硝酸盐含量超标以及产量
本文讨论了油藏多学科工作中的建模前、数模前、建模后及储采状况分析工作。主要解决了三方面问题,一是油藏建模、数模过程中应用到的数据种类多、数据量大,数据文件格式不统
本论文在对岩心观察、描述以及分析的基础上,综合运用沉积学、测井地质学以及层序地层学等相关理论和方法,通过对测井、录井、岩心、地震以及区域地质资料的综合分析,对柳屯