【摘 要】
:
CRISPR/Cas9作为新一代的基因定点编辑技术,具有成本低廉,操作简单等优点,现已被广泛应用于基因编辑领域。目前CRISPR/Cas9系统所面临的两个重大问题是如何最小化CRISPR/Cas9的脱靶效应,以及最大化CRISPR/Cas9的sg RNA对目标DNA的靶向切割效率。对这两个问题实现精准的预测可以为CRISPR/Cas9的实际应用提供指导,机器学习的飞速发展为解决这两个问题提供了新思
论文部分内容阅读
CRISPR/Cas9作为新一代的基因定点编辑技术,具有成本低廉,操作简单等优点,现已被广泛应用于基因编辑领域。目前CRISPR/Cas9系统所面临的两个重大问题是如何最小化CRISPR/Cas9的脱靶效应,以及最大化CRISPR/Cas9的sg RNA对目标DNA的靶向切割效率。对这两个问题实现精准的预测可以为CRISPR/Cas9的实际应用提供指导,机器学习的飞速发展为解决这两个问题提供了新思路和新方法。本文针对CRISPR/Cas9系统的脱靶效应以及靶向效率预测进行了深入的研究,提供了两种新方法,主要研究内容如下:(1)CRISPR/Cas9的脱靶是指CRISPR/Cas9错误定位到非目标DNA位点,产生错误切割。为了快速,准确地预测CRISPR/Cas9的脱靶效应。本文以集成学习思想为核心,提出了新的编码方式,并整合了四种已有的CRISPR/Cas9脱靶分数,采用XGBoost模型构建了预测器,在训练集以及独立测试集上取得了良好的性能表现,相比已有的工具提升明显。(2)CRISPR/Cas9的靶向效率是指CRISPR/Cas9采取特定sg RNA对定点DNA进行靶向敲除的效率。CRISPR/Cas9通过识别PAM序列识别潜在的靶向位点,并通过sg RNA与目标位点发生碱基互补配对,从而诱导Cas9核酸酶发生作用。然而对于不同的靶向位点,CRISPR/Cas9的效率存在着巨大的差异。本文对比了两种序列编码方式,并用集成的思想结合多种已有工具,构建了一个CNN-XGBoost模型用于预测CRISPR/Cas9的靶向效率,在数据集上性能良好。
其他文献
自古以来,知阴谋、善使阴谋者大有人在。关于如何使用阴谋的书籍在西方著作中以《君王论》为代表,而东方著作更是络绎不绝:自《鬼谷子》一书宣扬趋炎附势,讲究为达目的,誓不
本文基于提高税收风险管理水平的要求和热力行业增值税管理的现实状况,对热力行业增值税税收风险识别进行研究。首先对热力行业生产经营规律和增值税管理现状做了简要介绍,深入分析当前热力行业增值税税收风险产生的原因,归根结底是由于缺少一套科学有效的税收风险识别模型,归纳整理税收风险的主要表现和这些表现在税务机关掌握数据上的反映,为税收风险识别模型的建设打好基础。为了能够更加准确有效地建立热力行业增值税税收风
伴随着互联网技术的日渐普及,越来越多的用户开始接触社交网络并养成了使用社交网络的习惯。人们关心的日常话题会在第一时间以最快的速度通过社交媒介传播开来,尤其是与人们生活密切相关的国民安全话题。突发话题出现时,大量的相关舆情信息会在以微博为代表的社交网站中传播。为了能够迅速准确地检出相关的突发话题,本论文实现了海量数据的实时采集和突发话题检测、挖掘与演进规律发现系统,采用自然语言处理技术等高效地检测突
地震发生后,如何快速获取灾区震情信息、绘制地震烈度图并准确评估地震灾情,是震后应急救援的关键问题。目前对于地震烈度的评估,尚未用到植被这一变化因素,但这一因素有以下几个优点:(1)植被覆盖反演有成熟的手段和方法;(2)计算简便,节约时间;(3)用于反演植被覆盖的遥感数据源很多。本文旨在探究地震前后植被覆盖的变化与烈度之间的关系,并分析地震前后植被覆盖的变化能否作为评估烈度的参考依据。目前的研究中,
在近现代科学发展史上,许多重要的、原创的科研成果都来自于优秀的科研团队。科研团队能够实现团队间的信息资源共享,提高科研生产率和促进科研创新。国家的科技体制改革以及《国家中长期人才发展规划纲要》已明确提出推进科研团队发展,因此科研团队的重要性不言而喻。由于科研团队数量的增多,相应的也出现了一些问题。现阶段,评审专家通过科研团队提交申报表进行科技创新团队评审工作,申报表内容多是文字形态,不能够直观地展
从历史上看,美国加息周期一般伴随着全球金融市场的震荡,并对随后的经济增长形成了扰动。本文通过将二十国集团作为研究对象,首先通过建立面板VAR模型,考察与研究美联储加息周期对全球造成的一般宏观经济效应,其次通过建立时变参数VAR模型,考察与研究美联储加息周期对每一个单独经济体造成的个体宏观经济效应,并对比分析了其异质性及时变性。研究结果表明,第一,美联储加息显著导致全球利率跟进上涨、货币大幅度贬值,
随着当今人们生活节奏的加快,汽车作为重要的交通工具,保有量正在快速增加,与之伴生的交通安全事故也呈现出逐年增加的趋势,而汽车防撞避碰系统可以有效避免交通事故的发生。
随着互联网基础信息设施的发展,衍生了更多的攻击面和攻击技术,产生了大量的安全事件,其中以恶意软件为基础的安全事件影响较大。随着人工智能技术的发展,我们能够使用机器学习来检测恶意软件,相较于传统检测技术,这是分析和检测恶意软件的一个新视角。本文设计和实现了一个恶意软件特征提取工具箱,此外,为满足粗粒度检测恶意软件的要求,提出了基于机器学习的恶意软件二分类检测模型,为了更具体地识别恶意软件的种类,提出
1951年上海市郊农村完成土地改革之后,市郊农村土地实行了国家土地所有制,加之市郊农村本身在历史发展过程中所形成的半工半农的社会特征,因此源于传统互助习惯的伴工组和以优待烈、军属为目的的帮工组在此基础之上得以产生。同时,这种在政府主导下的具有伴工优属特色的互助组,由于未能很好的解决组内农民最关心的等价互利问题,使得互助组在后期的发展过程中出现了很多困难。记工算账和生产先后矛盾问题的出现使得互助组陷
随着5G技术的大力发展,移动互联网以及物联网业务与最新通信技术如何相互融合,避免移动承载网络被管道化,进而最大化移动网络带宽价值的问题逐渐浮出水面,欧洲电信标准协会则应势提出了移动边缘计算技术。移动边缘计算技术是通过将计算负载从核心云数据中心转移到靠近用户端的移动边缘侧来减轻网络负担的,它将传统的云计算拉近到了用户侧的网络边缘,使得访问内容、服务和应用程序被加速,从而实现了在边缘端迅速响应。本文应