基于Nanopore长读长测序技术的全长LncRNA数据分析及其应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:wenjiakui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长链非编码RNA(Long noncoding RNA,Lnc RNA)是一类长度大于200碱基,且不具有编码蛋白质能力的RNA。Lnc RNA在真核生物细胞中广泛存在,近年研究表明,Lnc RNA能在细胞中以信号分子、分子诱骗物、蛋白质支架等方式参与细胞调控和细胞通信活动,且Lnc RNA被发现与肺癌、乳腺癌、胃癌等多种疾病息息相关。通过对Lnc RNA进行准确鉴定能够发现Lnc RNA的结构特征和表达差异,为揭示Lnc RNA与疾病之间的相互作用机制提供基础。近年来随着DNA测序技术的不断发展,以Pac Bio公司和Nanopore公司为代表的,具有超长读长的三代测序技术已经被广泛应用。利用长读长的测序技术鉴定转录本,能够避免二代测序短读长所需的复杂的组装步骤,可以直接获得转录本的全长信息。另外,目前全长转录本检测的文库构建方法多采用Oligo(d T)对poly A尾富集。该方法只对总RNA中含有poly A尾的RNA进行了研究,忽略了不含有poly A尾的RNA,特别是其中存在大量的新Lnc RNA等待发掘。本研究以肝癌细胞Hep G2和正常人肝细胞HL7702作为实验样本,通过Oligo(d T)富集poly A尾将样本分为poly A+和poly A-文库,采用Nanopore长读长测序,鉴定得到高可信度的全长转录本。然后利用Lnc RNA筛选方法,筛选得到已知的Lnc RNA和新的Lnc RNA,并对Lnc RNA进行特征分析,结构分析,筛选出名义的表达差异的Lnc RNA,最后对差异结果相关基因进行功能注释,得到poly A+与poly A-文库中Lnc RNA功能的差异,为进一步探究Lnc RNA与肿瘤相关功能机制提供了一定的生物学理论依据。本研究构建的基于长读长测序技术的全长Lnc RNA分析流程也能为鉴定无poly A尾的全长Lnc RNA提供一些方法参考。本课题主要分为以下三个部分:1.提取Hep G2肝癌细胞和HL7702正常肝细胞的RNA,使用Oligo(d T)富集含有poly A尾RNA,将文库分为poly A+和poly A-,poly A+文库按照试剂盒正常建库,poly A-文库去除核糖体后,利用PCR引物逆转录成c DNA进行建库。在Nanopore Min ION测序平台上分别对四个文库进行测序,测序数据通过碱基识别,低质量序列过滤,基因组比对,全长统计后,利用FLAIR工具获得可靠的全长转录本信息,并对四个文库的已知全长转录本比例进行比较,发现poly A+文库具有较高的已知全长转录本比例,poly A-文库中新转录本的占比较高,且有大量序列存在于基因间区。2.利用gffcomare将得到四个文库的转录本进行分类,按照分类结果筛选潜在的非编码RNA。筛选条件主要为:长度大于200碱基,具有较低的编码能力,开放阅读框长度小于300碱基,编码得到的蛋白质与已有的蛋白结构域不同。经过筛选得到的可信度高的Lnc RNA会与Lnc RNA数据库中已知的Lnc RNA进行比较,比对率大于90%的Lnc RNA被标记为已知Lnc RNA,其余为新Lnc RNA。之后对Lnc RNA结构特征进行分析,发现相较于poly A+文库,poly A-文库中的Lnc RNA具有更短序列和相似开放阅读框长度。3.将得到的转录本进行可变剪切分析,大量的可变剪切事件被检测。通过比较Hep G2细胞的poly A+文库和HL7702细胞的poly A+文库,以及Hep G2细胞的poly A-文库和HL7702细胞的poly A-文库之间Lnc RNA表达的差异化后,获取名义的差异表达的Lnc RNA上下游10kb的基因,并进行了功能注释,主要包括GO功能富集注释和KEGG通路分析。通过注释发现,poly A+组中的Lnc RNA富集结果多与细胞通讯以及蛋白质结合相关,而poly A-组中的富集结果多与生物大分子相互作用调控相关。
其他文献
学位
学位
视觉关系检测的目的是通过形式描述图像中的物体以及它们之间的交互关系(谓词)来提供对图像的全面理解。视觉关系检测在图像字幕生成,图像检索,视觉推理,以及视觉问答等计算机视觉任务中起到了至关重要的作用。在视觉关系检测任务中,谓词的识别历来是模型改进的重点。但是不同类别的谓词在视觉关系检测数据集中存在长尾分布的现象,不同类别样本数量的不平衡意味着某些谓词
学位
凝血试验用于判断机体止血功能有无缺陷,检验抗凝药物治疗后人体系统凝血的状况,为医生对病患疾病的诊断、抗凝药物治疗者凝血能力检测提供依据。常规的凝血仪器笨重、血样消耗多。本文设计并研制了一种基于电化学阻抗法的凝血测试仪,具有高便携性、检测迅速、耗材成本低、操作简单等优点,适用于医院和家居场景。本文的主要研究工作和成果如下:1)提出了基于电化学阻抗结合微流控技术实现多通道多项目测试的凝血检测仪系统设计
裂缝是混凝土裂缝是混凝土桥梁结构中最严重的缺陷之一。它不仅影响结构的外观,而且引起内部钢筋的腐蚀,加速桥梁的老化,降低结构的承载能力。因此,快速、准确地检测裂缝是混凝土桥梁检测和安全评价的重要手段。然而传统的裂缝检测技术费时费力,同时具有一定的危险性。随着科学技术的进步,数字图像处理技术作为混凝土桥梁裂缝检测的有力工具得到广泛的应用。本文借鉴数字图像处理和深度学习基本理论,对裂缝图像识别方法进行改
学位
在我国建筑业迈向工业化和现代化的发展方向上,装配式混凝土框架结构以其适合标准化设计、匹配信息化发展前景且更加绿色环保的特点,成为了行业关注的热点。在装配式混凝土框架节点的主要分类中,装配式湿连接节点以更高的可行性和安全冗余度得到了广泛的应用。然而,目前的装配式湿连接节点在进一步迈向工业化的过程中存在着施工精度要求高、节点区施工不方便以及成本难以控制的问题,削减了装配式框架结构在工程应用中的优势。在
湿式多片制动器是机械传动系统中的关键部件,因其制动力矩大、稳定可靠等优点,在重型车辆、工程机械、船舶装备中广泛应用。但是随着湿式多片制动器向轻量化、高速化方向的发展,制动器的工作环境愈加复杂,制动器在工作过程中常会出现摩擦元件振动、变形、烧蚀等各种失效问题。本文是以船用起重机的湿式多片制动器为研究对象,通过动力学与运动学分析对不同制动工况下制动器的制动性能进行了研究,同时根据摩擦元件的结构性能与热
学位