【摘 要】
:
随着人类基因组计划和多种模式生物基因组测序的完成,对于大量生物序列数据的有效处理以便寻找序列中蕴涵的信息成了目前生物信息学研究领域的热点问题之一。真核生物选择性
【出 处】
:
中国科学院研究生院 中国科学院大学
论文部分内容阅读
随着人类基因组计划和多种模式生物基因组测序的完成,对于大量生物序列数据的有效处理以便寻找序列中蕴涵的信息成了目前生物信息学研究领域的热点问题之一。真核生物选择性剪接在基因表达调控中发挥极其重要的作用,如何利用统计学习的理论和方法识别真核基因选择性剪接位点是目前生物信息学研究领域关注的问题。
针对真核基因选择性剪接位点识别问题,目前国内外已经提出了多种基于统计学习理论的识别算法,如支持向量机、隐马尔科夫模型、马尔科夫模型、神经网络、隐马结合支持向量机、马氏模型结合支持向量机、小波变换结合支持向量机等。但是这些算法中大多数并不能获得令人满意的识别率。即使有些方法在选择性剪接位点识别率上有不俗的表现,但是这些方法运算复杂性较高。
本文提出了一个基于离散余弦变换并经由支持向量机训练的选择性剪接位点识别算法。同时提出了一种新的编码方式,即混合伪图像编码方式。该编码方式有两个创新之处:(1)将一维编码方式和二维编码方式相结合,它避免了普通编码方式对单个碱基特性的信号或者碱基间跳转关系的信号丢失的问题,将单个碱基的特性以及碱基与碱基之间的跳转关系特性都加以很好的利用;(2)伪图像编码方式可以比以往所常用的向量形式更能把剪接位点附近的相关特征进行提取,针对此编码可以通过主成分提取方法达到降低算法时间复杂度的目的。
通过实验表明这个新的方法相对于其他方法的确获得了更好的效果。其识别率分别为70.73%(供体位点)和66.01%(受体位点)。
其他文献
目前,煤的燃烧是人类获取生产生活中所需能源的主要途径。但是,煤在燃烧的同时会产生大量的颗粒物和气态污染物,并排放到大气中,是造成环境污染的主要固定污染源。随着环境污染问
无线传感器网络作为一种多学科融合的产物,是目前科学技术发展最活跃的领域之一。对无线传感器网络性能的优化是目前的一个研究热点,它的意义不仅仅在于给使网络中的资源得到
视频矩阵切换器是一套可以将多路视频输入信号中的任意一路或多路分别切换到一路或多路显示终端上的设备,广泛应用于各类监控场所。
传统的视频矩阵切换器多是基于51类
针对新形势下战术训练的要求和现有战术靶报靶系统存在的不足,本文提出一种新的战术靶测控系统。该系统有战术靶探测和靶标的无线控制两个部分。战术靶探测部分在嵌入式平台上
自上世纪90年代中国助学贷款兴起以来,违约现象就一直深深影响和困扰着助学贷款的发展,对此,学者们围绕影响违约现象的因素以及助学贷款的制度设计进行了深入的研究。然而绝大多
在当代社会,互联网已经成为大部分人日常生活中必不可少的一部分,为人们的工作、学习和生活带来了极大的便利。互联网上存在大量的非结构化电子文本,如新闻、博客、电子邮件、聊
随着计算机软件、硬件技术的飞速发展与成熟,仿真技术在各大领域均得到了广泛的应用和发展,水下机器人仿真便是其中一种。然而仿真将会用到及输出大量数据,如果仅以数据方式
微光图像通常是在夜间等低照度条件下所获取的一类图像,具有对比度和亮度都很低的特点。智能手机、平板电脑、数字相机和航拍相机等设备的发展与广泛应用加剧了这类图像的产生
随着现代信息化战争的变革,作战力量愈来愈趋向于体系化,而多武器平台的协同作战则是作战体系的主要特征。面向新的战争形态也就有了新的技术需求,需要通过任务规划,综合考虑战场
电力电子设备的大量使用和非线性负载的不断增加致使公用电网的谐波污染日益严重。有源电力滤波器作为一种先进的优化电能质量的手段,可以提高公用电网的供电质量,而指令电流