【摘 要】
:
DNA序列测序技术在遗传信息和基础生物研究上有着重要作用。自20世纪70年代第一代DNA序列测序技术问世以来,经过近40年的快速发展,DNA测序技术取得了重大的进步。基于纳米孔的DNA序列测序是当前最新一代DNA测序技术,因其测序速度快、高通量、成本低等特点得到了科学研究者的广泛关注。DNA分子在通过纳米孔时,四种碱基分子所产生的感应电流各有不同,通过对产生的电流的分析得到DNA分子的序列,这就是
论文部分内容阅读
DNA序列测序技术在遗传信息和基础生物研究上有着重要作用。自20世纪70年代第一代DNA序列测序技术问世以来,经过近40年的快速发展,DNA测序技术取得了重大的进步。基于纳米孔的DNA序列测序是当前最新一代DNA测序技术,因其测序速度快、高通量、成本低等特点得到了科学研究者的广泛关注。DNA分子在通过纳米孔时,四种碱基分子所产生的感应电流各有不同,通过对产生的电流的分析得到DNA分子的序列,这就是纳米孔DNA序列测序技术的理论基础。而影响纳米孔测序技术发展的主要因素是基于纳米孔的DNA测序算法的好坏。本文根据对纳米孔测序基本原理的分析,提取碱基的电流改变量和持续时间作为DNA分子的特征向量进行基于纳米孔的DNA测序算法的研究。论文主要内容如下:首先,根据基于纳米孔DNA序列测序的基本原理,分析DNA分子通过纳米孔时诱导电流的变化情况,将DNA分子通过纳米孔时所引起的电流改变量和电流改变的持续时间作为描述DNA分子信息的特征向量。同时,由于纳米孔测序过程中会产生各种噪声干扰,本文在对噪声来源与产生机制分析后,采用小波去噪方法对所得实验数据进行去噪处理,减少噪声对真实信息的干扰。然后,根据深度学习理论,本文建立了基于隐马尔可夫模型的隐马尔可夫DNA序列测序模型,同时针对模型中出现的一些问题,本文优化了该模型,建立了优化隐马尔可夫DNA测序模型。同时,在进一步探究中,本文建立了基于RNN神经网络模型的RNN神经网络DNA序列测序模型,并通过仿真实验确定合适的模型参数。再进一步对纳米孔测序DNA序列测序原理分析的同时结合现有测序算法,提出了新的基于RNN神经网络的负反馈RNN神经网络DNA序列预测模型,通过对该模型训练效果的分析,确定合适的模型参数。最后,本文使用三种评价标准:测序准确率、Hamming loss(汉明损失)系数和Kappa系数对隐马尔可夫DNA序列测序模型、优化隐马尔可夫DNA序列测序模型、RNN神经网络DNA序列测序模型和负反馈RNN神经网络DNA序列测序模型的DNA序列测试结果进行评价分析,结果显示负反馈RNN神经网络DNA序列测序模型预测准确度有着明显的提高,其模型对DNA分子的分类能力强于其余三种模型。
其他文献
王骥德是明代著名曲学家,一部《曲律》奠定了他在中国古代戏曲理论史上的崇高地位。同时他也是一位勤于实践的剧作家,早年著有多部戏曲作品,但除了传奇《题红记》和杂剧《男王后》外,其余惜已失传。鉴于王骥德的戏曲创作尚无专文研究,而他本人又是著名的曲学家,本文拟以王骥德的曲论为参照系,深入探讨他在戏曲创作方面的得失及成因。主要从以下四个方面进行研究:第一章主要关注的是王骥德剧作的题材选择与艺术构思方面的问题
为探寻合适的林药复合模式,促进区域可持续发展,在安徽广德市邱村镇,选择不同的复合经营模式(纯白芨(Bletilla striata)、毛竹(Phyllostachys pubescens)-白芨、悬铃木(Platanus acerifolia)-白芨、山核桃(Carya cathayensis)-白芨))的林分为研究对象,综合分析了不同林药复合模式对土壤理化性质和微生物群落结构的影响,并深入研究不
发展城市轨道交通被视为解决城市交通问题、缓解交通拥堵的重要措施,国内很多城市正致力于修建城市轨道交通系统。随着城市轨道交通网络日益成熟复杂,网络化运营和大客流管理使这一复杂交通系统在突发事故的应急处置中面临诸多新的问题和挑战。当轨道交通系统发生突发中断事件时,需要对乘客进行应急疏散,应急公交接驳是城市轨道交通乘客应急疏散的重要手段,其核心内容为应急驻车点选址和接驳线路规划。本文旨在针对城市轨道交通
切巷作为采煤工作面回采的起点,主要用于安装回采相关设备,是煤矿开采的重要场所。工作面相关设备的安装和工作面回采需要相对稳定的切巷围岩条件,因此合理有效的切巷围岩控制技术在确保工作面的生产安全,提高工作效率,降低巷道支护费用等方面具有重要意义。但切巷不同于一般的煤层巷道,其跨度、宽高比大的多,切巷宽度成为影响其围岩稳定性的主控因素。另一方面,厚煤层工作面的切巷大部分都设计于煤层的底部,巷道两帮及顶板
本研究探究了全舍饲条件下,不同能量水平日粮对生长期牦牛生产性能、血液生化指标、瘤胃发酵情况、营养物质表观消化率及肉品质的影响。试验一不同能量水平日粮对生长期牦牛
教师是培养国家新一代人才的中坚力量,尤其是高校教师,他们不仅是知识的传播者和创造者,也是高校教师队伍建设的直接参与者和质量保证者。本研究主要是探究了如何通过继续教育的手段来弥补教师在专业素养方面存在的不足。本研究从专业化的背景入手,通过文献综述,归纳出近年来对高校教师继续教育的研究呈现出理论性研究多于实践性研究的畸形研究趋势。通过梳理具有权威的文献资料得出教师专业化、教师专业素养、继续教育等相关的
背景和目的:结直肠癌是全球第三大常见恶性肿瘤。在中国,直肠癌的发病率约占结直肠癌总发病率的60%,且其临床预后较差。这项研究通过生物信息学技术分析找出直肠癌中的差异表达基因,为直肠癌提供新的治疗靶点。材料和方法:从GEO数据库下载GSE20842、GSE136735、GSE139814基因芯片数据集,通过GEO2R获得直肠癌中的差异表达基因,使用R包cluster Profiler完成所选差异基因
研究区域气候对当地粮食种植与收获可能产生的影响,探讨该地区气温和降水等变化条件与粮食产量品质的相互关系,对于气温和降水等条件下该地区粮食产量品质提高潜力的发掘与模拟,从而使粮食产量增加不间断具有重要意义。本文收集了哈尔滨东部三个县市60年来的气温和降水数据,并对作物生育期五-九月份的数据进行分析。结果如下:(1)从1959到2018年,哈尔滨市东部的五、六、七、八和九月份的日平均气温的变化范围分别
随着微波功率器件的发展,4H-Si C MESFET器件因其在高功率、高频率和耐高温高压等方面的优良特性受到了人们的关注。在微波功率器件具有越来越大输出功率的今天,其能量转换效率也成为微波功率器件研究的新热点。具有高能效的微波功率器件不仅可以节能环保,还可以降低器件的发热。因此,保证4H-Si C MESFET器件具有良好输出功率的同时,提高其功率附加效率是本文的主要研究目标。本文首先利用ADS软
α-乳白蛋白(alpha lactalbumin,α-LA)是乳清蛋白中结合钙离子的主要蛋白,能提高免疫力,具有抗癌、抗微生物的功效。其所含丰富的必需氨基酸和支链氨基酸有助于促进婴儿的神