【摘 要】
:
本文以机器学习中的支持向量机作为主要分类方法,将主要精力放在如何从生物信息序列中提取出对分类有用的特征上.通过对蛋白质序列自身的结构特征的分析,可以发现直接利用序
论文部分内容阅读
本文以机器学习中的支持向量机作为主要分类方法,将主要精力放在如何从生物信息序列中提取出对分类有用的特征上.通过对蛋白质序列自身的结构特征的分析,可以发现直接利用序列不能进行有效的分类,因为从信息学的角度来看,蛋白质序列只是由20个符号按照某种人们未知的规律所组成的字符序列;氨基酸的物理化学属性是可以将氨基酸进行互相区分及替换的一种信息,这些信息有助于分类特征的描述,通过实验证实了使用氨基酸的物理化学属性作为特征可以取得不错的分类效果;支持向量机是一个强大的有指导机器学习方法,本文介绍了支持向量机方法的理论基础和实验方法,并通过实验结果分析了影响分类效果的几个因素;我们提出了一种结合物理化学属性和n元文法或信息增益的改进特征提取方案,在这种方案下,原有的分类准确率得到了进一步提高;另外,在我们的实验过程中得到了一些可能对将来的研究有用的序列片段,我们希望在生物学家帮助下得出这些片段的生物学意义.
其他文献
由于存在结点失灵的可能,Fischer等人证明了异步系统中不存在一致合意的确定性求解算法[1 ],为此,Sam Toueg等人提出了异步分布式系统中的故障检测器技术[ 2]。故障检测器作
近年来,随着计算机技术、网络技术和多媒体技术的不断发展,多媒体和网络通信相结合的应用大量出现,并深入到社会生活的各个领域。作为它们中典型的一个应用,基于IP的多媒体会
随着现代计算机网络的开放性、共享性和互连程度不断扩大,应用系统面临着更为复杂的安全威胁,病毒的泛滥,攻击活动的多样性和随机性,其手段越来越复杂和隐蔽,安全性问题越来越突出
Peer-to-Peer(P2P)系统是基于对等计算模型构建的网络系统,由于该网络系统具有良好的可扩展性、可靠性及开放性等诸多优点,并且适应网络环境和节点的动态变化。本文主要对
随着下一代网络(NGN)的逐渐部署和应用,对下一代运营支撑系统的需求亦开始凹现出来。下一代运营支撑系统应充分体现“以客户为中心”的思想,在网络管理中服务客户的重点内容是为
本文主要做了以下研究工作:对有线网络的结构特点、作为网络结点的协议支持和安全隐患等进行分析.本文通过在网络协议的MAC层之下添加链路安全子层来完成加密功能.研究了具有
本文以Pioneer3全自主机器人以及作为月球车开发平台,进行相关的模拟月球车的目标跟踪与避障系统开发工作。本文重点论述了如何利用视觉传感器信息,在其他传感器(主要
This thesis designs and implements a Network-based Monitoring System,which is used to monitor the nodes of Information Analysis System of Large-scale Network.Th
面向核心企业的供应链管理(MEO-SCM)是一种供应链优化方式,它通过与渠道伙伴(包括供应商、第3方服务商,客户)的协调合作,从而像一个单一的企业那样达到紧密集成。由于客户需
本文通过把人类染色体的YAC-STS数据转化为染色体的克隆—探针矩阵,并以缺口最小化模型为基础,力图在该模型下找到一种优于现有其它算法的探针排序.我们提出了一种基于模拟退