蛋白质序列GO注释数据库系统的研究和构建

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zy07021023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息数据库贮存了生物信息学研究的原始数据和各类计算结果数据,可以提供给生物学家们思考分析以及进一步探究其表达的生物学含义,具有非常重要的意义。然而,针对生物信息计算流程的特点建立数据库应用系统还未在计算机界引起广泛重视。在国际著名生物信息数据库的相关报道中,大多也仅强调其数据的收集方式和具有的生物信息学意义等。少量文献涉及了数据库系统的存储模式,以及对数据更新变化的适应性等。为了更好地进行生物信息数据库系统的研制与开发,针对特定的生物信息大规模计算分析流程,分析抽象出生物信息数据库系统的特点与功能需求,进而研制相关的策略与处理技术,是更好地建立生物信息数据库应用系统的一条有效途径。据此,在总结生物信息数据库特点的基础上,构建了蛋白质序列GO注释数据库系统。在针对注释系统的处理流程、原始和计算结果数据进行分析后,得到了数据库需求分析的结果,包含相应的事务处理要求。建立了以注释工具为核心的存储模型,并依据需求分析的事务处理要求对存储模型的功能进行了有效性验证。采用序列分离存放、树型结构的XML表示法,以及MySQL数据存储技巧等措施制定了数据的存储策略,提高了数据库的导入和查询检索效率。建立了数据库系统数据的自动更新机制,使得数据能与国际公共共享数据同步,保证了数据库的生命力。由于分析的特点与采用的策略对于生物信息数据库系统具有一定的普遍性,蛋白质GO注释数据库系统的研究也为下一步构建基因组结构注释数据库系统奠定了坚实的基础。
其他文献
近十多年来,随着数字技术的迅速发展,每天都有来自不管军用还是民用数以亿计的新的图片产生。为了有效地利用这些信息,我们就不得不找到一种可以有效浏览、搜索及索引这些图
随着互联网的快速发展和电子商务应用的不断深化,大型网上购物系统越来越多。为了提升市场竞争力,推荐系统被引入电子商务中。基于用户和基于项目的协同过滤推荐系统得到了广泛
计算机辅助诊断技术是通过医学影像处理技术,结合计算机的分析计算,辅助发现病灶。随着计算机科学技术的发展,应用领域不断扩张,计算机与医学图像相结合的计算机辅助诊断技术
颜色恒常性计算是一个多学科交叉性很强的研究课题,融合了计算机视觉、信号处理、人工智能和认知科学等学科的相关技术,用于解决计算机视觉中的物体识别、对象跟踪、视频监控
正交投影在几何建模、计算机图形学以及计算机视觉等领域受到广泛的关注。正交投影在曲面曲线的设计、曲面与曲线的拟合方面有着重要的应用;同时,它也是形体匹配的ICP算法中
空气是我们共享的重要的生存资源,但是近年来某些区域的空气质量却呈现出逐渐恶化的趋势,尤其是对于一些发展中国家的超大型城市,如北京和新德里,空气污染已经成为这些城市一个很严重的问题。在空气污染的众多维度中,细粒度颗粒,尤其是PM2.5近来越来越受到人们的关注,其中很重要的原因在于PM2.5在人们身体健康的直接影响,有研究资料表明PM2.5粒子很容易被人体肺部器官吸收,长时间的PM2.5环境会导致呼吸
移动自组织网是一种由带有无线通信装置的移动终端所组成的无中心控制系统的网络,其最大的特点是自治和多跳,具有组网快速、抗毁性强等优点,被应用于军事通信、灾难紧急救助
随着IP技术的发展和成熟,越来越多的业务将转为在IP网上实现,未来网络是以IP为核心传送网的下一代网络(Next Generation Network,NGN)。现有的网络将逐步融合,其中IP网络和电信
随着我国移动通信网络规模的不断扩大和通讯技术的不断成熟,我国的移动通信用户数量不断增加,国内通信市场的竞争也越来越激烈。提供更加优质的服务,满足用户各种各样的需要,已成
随着计算机技术的快速发展,CG技术逐渐取代了效率低下,成本高的传统动画技术,CG产业已成为新兴的创意工业,商业价值巨大。在CG制作过程中,产品设计制作并非一次就能成功,一件