基于Q学习的生物序列比对方法

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zhangjunfeng_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是生物信息学中最常见的问题之一,也是一种重要的生物信息处理技术。它通过对生物序列数据进相似性比较,来发现生物序列中的功能、结构和进化等信息,是基因识别、分子进化、生命起源等生物信息学研究的基础。强化学习是一种无监督的机器学习技术,能够利用不确定的环境奖赏发现最优的行为序列,实现动态环境下的在线学习,因此被广泛用于Agent的智能决策。目前主流的强化学习算法是Q学习算法,它是在强化学习基础之上发展起来的一种新的机器学习方法,因其自身特点已经成为人工智能领域的研究热点。但Q学习本身存在一些问题。首先,Watkins提出的Q学习原型,采用贪婪策略选择当前动作,这种策略是一种一步策略,使得当前动作对于将来影响估计不足;其次,当状态空间很大时,Q学习算法的存储空间比较大而且学习速度较慢。本文针对生物序列比对中的具体问题,对Q学习算法进行了一些扩充和改进,提出一种基于Q学习的生物序列比对方法。本文的主要工作为:1.提出一种基于Q学习的生物序列比对方法用Q学习的方法解决序列排列的问题的思想:把寻找两条序列最佳排列的过程视为一个Agent自主学习,寻找最有策略的过程。在该过程中把待比对序列和为了获得最佳排列而插入序列的空格视为一组状态,把直达下一个核苷酸(氨基酸)还是插入空格看作是将要采取的行动,采用空位罚分或者打分矩阵计作为评价函数,计算Agent每一次采取不同行动的立即受益,计算每种策略的累积预期收益,选择累积预期收益最大的策略指导下一步的行动,将获得最大收益的序列作为最终的最佳序列排列。在计算累积预期收益的过程中引入多步Q学习机制,选择当前状态直至将来k步的最优策略指导下一步的行动。这样既避免了Watkins Q学习采用贪婪策略选择当前最优策略的一步策略短视问题,又避免了Q(λ)学习的状态行动对数量过于庞大,引起的收敛速度慢的问题。给出了时间复杂度和空间复杂度的公式证明,通过实验证明该方法有效地降低了时间复杂度和空间复杂度(O(kn))。利用VC++6.0在Windows XP平台上开发完成SAQL模型。取得了令人满意的效果。2.基于Q学习的生物序列比对方法的基础之上提出一种具有先验知识的基于Q学习的生物序列比对方法。先验知识建立于Agent以往成功的学习经验基础之上,当Agent每次进行新的学习任务时,由模糊综合决策专家系统为其提供先验知识。通过实验比较发现具有先验知识的SAQL较单纯的SAQL有改善。
其他文献
随着信息技术的发展,互联网中的数据呈现出数据爆炸的趋势,信息检索系统已经成为人们获取有用信息不可缺少的工具。传统的文本信息检索方法的基本思路为,查询式和预存的文本
智能规划已经成为人工智能的研究热点,尤其是基于概率方法的不确定规划算法的研究。概率方法定量的刻画了现实世界中的不确定性,更适合于求解现实世界中的规划问题,从而得到
在现代社会,随着科学技术的进步和网络技术的飞速发展,以网络为基础的集群并行计算环境以其较高的性价比引起了人们的广泛重视。集群并行计算机系统是利用高速通信网络将一组高
所谓3G手机即第三代手机,是泛指能够将语音通信和多媒体通信相结合的新一代移动通信系统。3G手机具备强大功能的基础是极高的数据通信速度,目前的GSM移动通信网的传输速度为960
随着Internet的迅猛发展和多媒体通信技术的快速进步,在IP网络上进行远程教育越来越受到人们的广泛重视,网络上的通讯技术己经成为现代信息社会不可缺少的一种需求和技术热点。
本文研究探讨了基于P2P的电子供应链管理,从三个方面进行分析和研究,分别为电子供应链管理理论;P2P技术及其在电子供应链管理中的应用。全面介绍了电子供应链概念、特点、结构及
无刷直流电机保持了普通直流电机优良的机械性能,同时克服了直流电机换相电刷易于产生火花等弊端,因此在家用电器,机器人,仪器仪表,以及医疗器械等方面得到广泛的应用。无刷直流电机存在周期性的换相转矩脉动,限制了其在高端伺服领域的应用。同时,位置传感器的存在提高了系统成本,降低了系统在复杂环境下的可靠性。因此对无位置传感器无刷直流电机换相转矩脉动抑制策略的研究具有重要的理论意义与实践应用价值。论文的主要研
在项目反应理论中,如何合理的选择参数估计方法是一个重要问题。用于项目反应理论中参数估计的方法有χ2/EM方法,SQRT/EM方法,修正的MIDI方法,等等。本文引入一种新的参数估
数据挖掘(Data Mining)是在应用需求的背景下产生并迅速发展起来的、开发信息资源的一套科学方法、算法及软件工具和环境,是集统计学、人工智能、模式识别、并行计算、机器学
目标跟踪是无线传感器网络的一个重要应用,如军事侦察中的车辆跟踪、生态监测中的动物追踪等。在这些应用里,由于传感器节点的电池能源有限,使得跟踪质量和网络生命周期成为