论文部分内容阅读
生物信息学(Bioinformatics)发展至今,工作重心已经从数据的积累转移到数据的分析上,特别是应用于序列分析的软件开发已经成为一大热点。随着大量生物信息学软件的开发与应用,生物学研究的效率得到了很大的提高。生物信息学最基本的任务是序列分析,目前市面上流行的分析工具各有特色,运行会因不同的分析软件而得到不同的结果,特别是序列比对所使用的算法参数在很大程度上直接影响分析结果。有时会由于采用了不合适的参数而丢失一些隐藏重要统计学意义的重要信息,导致时间和精力的浪费。因此,序列比对算法的选择很重要。在研究了生物信息学的基础知识、序列比对的算法、国内生物信息学软件软件的发展现状的前提下,本文在前人研究的基础上,采用JAVA语言设计开发了一个专用于序列分析的生物信息学软件,本软件具有BLAST双序列比对、氨基酸查找、序列统计、提取序列信息、文件格式转换等主要功能,旨在为研究人员提供一个简便、快捷的分析窗口,方便用户进行序列比对,序列文件分析等操作。开发出来的软件能实现序列文件的相关分析,能从大量的序列信息中获取基因结构、功能和进化等知识,是一个界面友好、操作简单、计算正确的实用软件。程序开发之前搭建一个良好的JAVA环境,包括JDK工具集的安装和环境变量设置以及开发平台MyEclipse 6.5的安装设置等。软件设计过程中,围绕BLAST比对功能,逐个实现各模块的功能,所有代码均反复单独调试和修改Bugs;同时,还注意了不同模块之间的衔接性。软件完成后,封装成jar包,同样运行于JAVA环境下。对完成的软件进行测试,调用其中的功能对fasta序列文件进行分析,能得到理想结果。其他功能如氨基酸查找、序列统计、提取序列信息、文件格式转换等也都运行良好。