考虑DNase偏差信号的蛋白结合位点分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fisher9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自ENCODE计划以来,人类对于DNA碱基代码功能和生物作用信息的探索从未间断。研究基因编码过程的核心是DNA蛋白结合位点分析,而理解 DNA蛋白与结合位点之间相互作用是分析基因表达调控的关键。DNase-Seq技术能够在全基因组范围内检测DNA蛋白质结合位点。与已相对成熟的ChIP-Seq技术相比,有能力一次性检测基因组范围内全部DNA蛋白结合位点,且检测精度达到单碱基。基于此,本文研究并提出了一种考虑DNase偏差信号的DNA蛋白结合位点分析方法。该方法运用支持向量机实现DNA蛋白结合位点的预测与识别。  在研究中,首先提取同一样本的ChIP-Seq和DNase-Seq实验数据,利用ChIP-Seq数据测得的准确DNA蛋白结合位点,获取DNase-Seq对应信息并构建数据集。在DNase-Seq数据预处理中,发现剪切信号具有碱基组合倾向性,导致数据存在偏差。随后,设计一种公式推导算法去除该偏差。利用去除偏差后的DNase-Seq数据,以结合位点区域窗口数据为正样本,远离结合位点窗口数据为负样本,训练支持向量机识别模型。最后,用训练好的模型预测DNA蛋白的结合位点。  在模型效果验证中,去除偏差之后数据训练的模型比未处理数据训练的模型获得更好的识别效果。
其他文献
随着计算机网络技术的普及,世界范围内的产业结构发生了根本性的变革,促进了全球信息化的发展,在工业控制领域,控制网络技术已经成为自动化技术研究的热点。 传统的控制方
本文建立了EPS动力学模型和ASS整车动力学系统模型,分析两个系统之间的相互影响,建立了EPS和ASS的集成模型,综合考虑路面干扰与转向行为对车身姿态的影响、EPS对操纵稳定性的
无线传感器网络(Wireless Sensor Network)融合了微传感器、嵌入式计算、现代网络和无线通信四大技术,作为一种新的计算模式推动着科技的发展和社会的进步。它能够通过各类集
姿态确定与控制系统是卫星设计的重要组成部分。本文以某在研卫星(MTS)为背景,对三轴稳定卫星姿态控制系统的分析、设计和仿真进行了深入的研究,主要工作有以下几个方面: 首
机器视觉技术具有功能强、精度高、稳定性好等优点,随着工业智能化的不断发展其在各类工业领域广泛应用。其中,基于机器视觉的产品外观检测是近年来的一个热门研究课题。产品外观一般分为平面与曲面两种类型,不同类型的外观检测系统硬件搭建有所区别;当工件检测精度高以及检测区域不固定时,普通的定位算法和区域分割算法就不能满足要求;工件外观检测除了包括表面瑕疵检测还有一些高度测量方面的内容(如:3D图像转换成2D图
传统的图像分割方法主要是基于图像的灰度特征的。分割算法可分为利用区域间灰度不连续性的基于边缘的算法和利用区域内灰度相似性的基于阈值的算法。  人类视觉系统初级阶
随着人工智能技术、机器人技术以及多智能体系统(MAS)等研究的深入,如何组织和控制多个机器人来协作完成单个机器人无法完成的复杂任务已经成为机器人学研究领域的新课题,而
随着无线通信和移动互联网技术的快速发展,越来越多的人们离不开无线网络带来的实时性、快捷性和方便性。尤其是人们在室内环境中使用移动终端使用无线通信的情况占据大部分
  本文在综合分析现代物流、信息技术、人工智能等相关领域的最新研究成果的基础上,明确提出了ILS的概念,分析了其内涵和特点,重点研究了ILS的智能机理。提出了基于Agent的复
人眼对颜色的敏感度比对亮度的敏感度更强,彩色图象包含更大的信息量和更丰富的视觉感受。长期以来,在视觉研究领域的大部分研究都是针对灰度图象的。随着彩色图象设备越来越受