基于遗传神经网络的转录因子结合位点识别方法研究

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:mailnewsnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学中的一个重要研究内容就是对基因转录调控的研究。转录因子结合位点的正确识别既是揭示转录因子功能的关键之一,又是理解基因转录调控机理的重要环节。转录因子是一种特异性DNA结合蛋白,它能够识别一段特定的DNA序列(转录因子结合位点)并与之结合,进而调节DNA的代谢和转录。随着对基因研究的不断深入,为了更好地了解基因表达调控机制特别是转录调控机制,人们已经开发了许多识别和预测转录因子结合位点的算法和软件,但还有很多方面需要进一步完善和加强。 作为模式识别的有力工具,神经网络具有良好的非线性逼近性和鲁棒性,已经被广泛并成功地应用于序列分析中。BP神经网络的学习规则多采用梯度下降法,梯度下降法虽然速度快,但是却容易陷入局部极小,导致其全局寻优性能不高。遗传算法具有可靠的全局搜索能力,它不依赖梯度信息,而是通过模拟自然进化过程来搜索最优解。所以,本文结合遗传算法与梯度下降法的优点,设计了一种训练神经网络权值的混合优化算法,可以利用它来解决网络学习初始权值的选取问题。并将基于遗传算法优化的BP网络模型用于转录因子结合位点识别问题上。实验所需的数据,本文利用Metlnspector打分方法结合一致性序列模型的方式来产生。根据一致性序列模型生成若干序列片段,然后利用Metlnspector打分函数打分,按分值比例选取试验样本。通过这种数据处理方式可以获得更多更接近真实数据的实验样本,弥补转录因子结合位点数据量少的不足。 本文使用MATLAB语言来实现算法功能,对应于5组实验数据,分别构建了5个遗传算法优化的BP网络。文章最后对遗传算法优化的BP网络和同规模的纯BP网络以及遗传算法预测的实验结果做了比较。结果表明,遗传算法优化的BP网络的性能优于纯BP网络和遗传算法。
其他文献
Web服务组合框架及相应平台开发的研究是目前面向服务计算的重要研究内容。现行Internet平台下的Web服务组合技术面临着多方面的挑战,如Web服务的被动性、协同方式单一、集中
生物认证技术是利用人体固有的生理特征,如人脸、虹膜、指纹、以及行为特征,如步态等对个体进行识别的身份认证技术。近几年来,由于对安全问题的重视,生物认证技术得到了长足
智能规划已经成为人工智能的一个研究热点,特别是规划图方法(GraphPlan)的提出更是使智能规划的研究取得了革命性的进展。随后的许多规划器都是在此基础上的,如1999年提出的P
近年来,随着现代通信技术的飞速发展和计算机互联网技术的迅速普及,信息的共享、传播变得尤为重要。它给人们带来种种便利的同时也带来了一系列的信息安全问题,比如信息窃取
随着计算机技术、通信技术和半导体技术的快速发展,物联网成为新一代信息技术的重要组成部分。作为物联网中的一个重要组成部分,无线传感器网络应用也越来越广泛,与此同时,对
当今世界,高新科技的迅猛发展深刻地改变着整个世界的面貌,推动着整个世界的经济、社会、文化持续快速向前发展。整个世界已凸显全球化、信息化和知识化的特征。世界正变得越
制造网格的出现,实现了地理上分散的各类制造资源的全面连通和共享,形成了一个庞大的资源库。用户想要像使用本地资源一样方便地使用资源库中的资源,必须有效的发现所需的资
当今对图像、视频、药物分子、文本、空间数据、基因等数据的高阶高维信息规律进行分析是目前机器学习、数据挖掘等领域迫切需要解决的问题之一。相对传统的向量化的数据分析
C语言试题库是学校C语言考试系统的基础。由于常年的使用以及原系统缺乏重复试题检查功能,在试题库的不断扩充下题库里难免存在大量重复试题,这样就导致了试卷质量和考试效果
半导体技术的飞速发展使微处理器的运算能力迅速提升,但访存速度的增长却相对缓慢,“存储墙”问题日益明显。存储系统有限的片外带宽已经成为阻碍程序整体性能提升的瓶颈。分