【摘 要】
:
启动子是基因表达调控的重要元件,深入研究启动子的序列结构特征和功能,是理解基因转录调控机制和表达模式的关键。在后基因组学时代,数据的可用性使得建立用于检测启动子的计算模型成为可能。到目前为止,启动子的识别主要是通过生物实验方法来实现的,这往往需要更多的时间和物力,通过计算方法识别启动子类型已成为一种更为有效的预测和分类方法。本文主要构建了新的特征提取方法,通过大量实验研究了基于融合深度学习算法的大
论文部分内容阅读
启动子是基因表达调控的重要元件,深入研究启动子的序列结构特征和功能,是理解基因转录调控机制和表达模式的关键。在后基因组学时代,数据的可用性使得建立用于检测启动子的计算模型成为可能。到目前为止,启动子的识别主要是通过生物实验方法来实现的,这往往需要更多的时间和物力,通过计算方法识别启动子类型已成为一种更为有效的预测和分类方法。本文主要构建了新的特征提取方法,通过大量实验研究了基于融合深度学习算法的大肠杆菌启动子识别和分类的方法,主要研究内容如下:1)构建了一个名为iPSW(2L)-CLA的大肠杆菌启动子两层预测器。基于RegulonDB数据库,使用CD-HIT软件去除冗余后得到基准数据集。首先,使用One-hot 编码方式和基于核苷酸的理化性质 和频率密度编码方式 来编码 DNA 序列。其次,采用多头自注意力机制来增强预测模型的学习能力。第三,使用两个一维卷积层、一个最大池化层来学习局部特征。最后,利用双向长短期记忆提取全局特征,从而进一步提高模型性能。在进行五倍交叉验证的方法下,该预测器在大肠杆菌启动子识别及其强度预测方面的AUPR分别为0.8339和0.8556,在第一层启动子识别和第二层启动子强度预测方面都比现有方法表现出更好的性能,表明iPSW(2L)-CLA预测器是可靠有效的。2)基于卷积神经网络构建了新的多类启动子预测模型iPro(2L)-LCNN。本文提出了一种轻量级、快速、简单的两层多类CNN架构,用于识别大肠杆菌基因组的启动子。第一层是预测序列是否为启动子的二元分类,第二层是将大肠杆菌启动子分类为子类σ70,σ54,σ38,σ32,σ28和σ24的多重分类。在基准数据集上进行实验,并与两种最先进的方法进行比较,预测结果显示该模型在五倍交叉验证方法下比现有预测器性能要好。此外,本文在一个独立测试数据集上测试了该模型,所得性能结果均优于其他方法,表明该启动子多分类的预测模型iPro(2L)-LCNN是可靠的。
其他文献
长期以来,世界各国都将维护妇女权益,提升妇女的社会地位,争取性别平等作为衡量国家进步的重要指标之一,2001年世界银行甚至将性别平等作为作为发展的目标之一,因为其认为促进性别平等是促进经济发展,实现社会治理和减少贫困人口的重要措施。在过去几十年中几次重要的国际会议政策中,也充分体现对提高妇女社会地位,促进性别平等的密切关注和重视,如2012年《世界发展报告》直接以“性别平等与发展”为主题。另外,截
夫妻关系是否和谐严重影响社会稳定,夫妻共同债务的认定是夫妻关系的重要一环。夫妻共同债务不仅影响夫妻财产关系的均衡,同时也极大地影响了债权人利益,进而影响市场经济利益的平衡,扰乱社会和谐稳定。因此,为了适应不同时期社会对夫妻共同债务认定的要求,最高院在婚姻法的基础上不断出台司法解释与相关规定补充。从未举债配偶一方到债权人举证,从“共同生活”到“婚姻存续期间”到“共同生活、共同经营、共同意思表示”,认
目的乳腺癌新辅助化疗是乳腺癌综合治疗的重要组成部分,在降低肿瘤分期、创造手术机会和提高生存率等方面具有显著作用,然而遗传性或获得性的肿瘤耐药常影响化疗疗效,导致乳腺癌治疗的失败。因此,寻找一种可以预测乳腺癌化疗敏感性的生物标记物变得尤为重要。本课题通过高通量芯片技术检测乳腺癌新辅助化疗前组织标本中lncRNA和mRNA表达水平,旨在寻找对新辅助化疗有实际作用的lncRNA,并通过探究lncRNA在
[目的]通过比较计算机手术导航与非导航手术方法对单侧B和C型颧上颌骨复合体骨折复位术后颧骨与邻近骨骼三维空间位置距离及角度,探讨这两种方法在单侧颧上颌骨复合体骨折复位术后三维方向的精确度以及优势和不足,以研究计算机手术导航在单侧B和C型颧上颌骨复合体骨折中的精确度及应用价值,从而为骨折的精确复位提供参考依据,指导骨折精确复位。[方法]选择南京大学医学院附属口腔医院南京市口腔医院口腔颌面外科2016
时代的极速变迁加剧了市场竞争的激烈程度,复杂的供应链网络结构和频发的灾难事故所带来的供应中断使得企业损失惨重,为了降低这种供应不可靠性,越来越多的企业选择扩大其供应源。但多源采购往往带来原材料质量水平不均的问题,为了统一最终产品的质量水平,核心制造企业可以选择投资其质量水平较低的上游供应商来促使其进行质量改进活动,以此提升供应链整体绩效。本文在考虑供应中断风险的情况下,主要研究了核心制造商面对两个
陶瓷辊道窑是一种连续烧成的窑炉,制品通过辊道在窑内依次进行预热、烧成、冷却三个阶段完成烧制。在烧制过程中,其温度的检测与控制方法直接影响陶瓷制品的烧成质量。传统的陶瓷辊道窑温度检测主要依靠热电偶传感器,其在高温多尘环境下存在精度变差和完全失效的问题,不利于辊道窑的长期稳定运行。为此,本文提出基于深度学习火焰图像识别来检测陶瓷辊道窑温度的方法。为了提高深度学习模型对火焰图像特征分类准确率,本文提出了
机械臂精度是衡量机械臂性能的重要指标。为提高机械臂的精度,需要对机械臂进行误差辨识与补偿,由于测量过程中常用的测量设备如激光跟踪仪等成本高且操作复杂,本文提出了一种基于双目视觉测量的机械臂误差辨识方法。研究结果如下:1.以LR7-710机械臂为研究对象,在完成双目测量相关设备选型后,提出采用非平行双目视觉结构模型用于图像采集。在测量过程中涉及到测量坐标系与机械臂基坐标系的转换,针对该转换关系难以精
照刷文卷制度自宋代建立,經過元代的發展,到了明代依然作為監察制度中重要的一環存在。照刷文卷制度就是監察部門通過對文書卷宗的查驗復核,來了解各級部門的運作情況,以起到糾百官、振綱紀的作用。本文旨在從新見四種《歷代史纂左編》紙背文書出發,通過整理和研究,使這些明代照刷文卷的實物資料發揮其文獻價值,為學界提供照刷文卷制度研究的細節之處。一,緒論部分首先從四種《歷代史纂左編》紙背文書的文獻價值入手,分析本