GO术语间语义相似性的度量方法

来源 :东北师范大学 | 被引量 : 7次 | 上传用户:quzoufeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关于相似性的研究在很多研究领域里都起到了关键作用。相似性的研究主要包括结构的相似性和语义的相似性。以往对结构相似性的关注和研究比较多,近几年,语义相似性吸引了越来越多的注意。由于历史原因所致,生物学数据来源非常复杂。为了减少或消除概念及术语的混乱,Gene Ontology协会开发了生物学数据的大型语义词典----基因本体GO(Gene Ontology)。GO应用的一个重要方面就是对GO术语的语义相似性进行度量。通常认为,如果两个基因产物的功能相似,那么它们的基因表达就相近,同时它们在GO中注解的术语就相似,所以我们只要能找出GO中术语对的相似度,就可以近似估计两基因表达的相似度,从而判断两基因产物功能的相似程度。所以说,GO术语间语义相似性的度量是解决生物学数据集成中语义异构问题的重要方法。本文首先介绍了关于GO的背景知识和对于语义相似性的研究;接着分析了当前GO术语间语义相似性的几种常用度量方法;然后主要针对其中最常用的一种提出了改进的措施----基于语义子图计算GO术语间语义相似性的方法;并以GO图的一小部分为例,做了算法的研究;最后对该方法进行了总结,并探讨了其更为广阔的应用空间。本文提出的方法是结合了基于信息量和基于概念距离两方面的方法,可使语义相似性测量的精确度得到进一步的提高,如果能应用到大的GO数据库中,将能更加准确地查找功能相似或者相关的蛋白质,为相关研究及应用打下良好的基础。
其他文献
健美运动对人体能够产生多方面的影响,因为健美运动是与人的形体美密切相联的,健美是形体美的基础.人体有对称的造型、均衡的比例,流畅的线条,坚强的骨骼,匀称的四肢,丰满的
近年来,平邑县在着力提高统计基层基础规范化建设水平上作了大量工作,取得了一些成效.但同时也存在着基层统计人员业务素质不强、办公条件不能完全满足普查需要等问题.本文通
偏振超光谱成像同时具备偏振成像与超光谱成像的特点,在探测到的图像中可以获取更多有关目标的信息,包括强度、空间、光谱以及偏振等多重信息。利用目标和背景的偏振特性,提
在经济新常态下,高新技术企业正以惊人的速发发展壮大,为国民经济转型发展做出了突出贡献.然而,由于高投入、高风险以及高收益的特点,高新技术企业面临着诸多财务风险和巨大
新会计准则是新时期更好促进企业发展发布的新的准则,和传统会计准则有着一定差距,给燃气公司发展也带来一定影响.但是目前很多燃气公司在新企业会计准则背景下还存在真很多
医药学的发展促使人们去探索细胞和分子水平的成像技术,分子影像便应运而生。自发荧光断层成像技术(Bioluminescent Tomography,BLT)作为分子影像中的一个分支,受到了广泛的
本文选择喀斯特峰丛洼地区域人工林群落:桉树林(EucalyptusrobustaSmith)、香椿林(Toonasinensis)、任豆林(ZeniainsignisChun);次生林群落:盐肤木林(RhuschinensisMill.)、
由于卫星光通信相比微波通信具有通信数据率高、通信容量大等优势,所以卫星光通信技术受到高度重视,为了提高卫星激光通信系统探测灵敏度,实现高速通信数据率,并且在综合考虑
应收账款是指企业因为销售产品、材料、提供劳务等业务活动而向购货方、接受劳务的单位或者个人应收取的款项.做好应收账款的管理,控制应收账款在企业营销收入中的合理比例,
中国经济新常态的出现表明了在市场改革进入白热化阶段后的殷切需求,同时证明了经济化全球化的方向和趋势,体现了中国在国际市场中不可或缺的重要地位.中国经济新常态是考量