基于二级结构的IncRNA对mRNA干扰的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:haojianhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA的研究方式主要是分为生物方式和计算方式两种。生物手段中,主要是通过一些生物技术,如使用生物芯片来测定RNA表达的差异性;使用荧光标记来测定RNA在特定的组织细胞中的表达情况;使用免疫共沉淀来验证RNA与其他RNA或是蛋白质的交互情况等。另外在一些疾病中,通过对RNA过表达或是低表达来分析其对疾病的影响程度。计算手段中,主要是从自身和交互两个角度出发:自身角度主要是从二级结构的角度进行研究,因为结构有比基本序列更加高的保守性;交互角度主要是RNA通常是和其他RNA或蛋白质交互来发挥作用的,并不是仅仅通过自身直接发挥作用。lncRNA因为在多个生物进程中,都发挥着重要的作用,而受到了越来越多的关注。采用生物手段对lncRNA进行研究需要大量资源的投入;由于lncRNA的长度较长,对lncRNA二级结构的预测的准确度很低。因此,分析可能与lncRNA结合的RNA特征,从lncRNA与其他RNA的交互角度进行研究是可行的。本文的主要目的是在合作单位某机构提供的mRNA和lncRNA数据集中,寻找通过结合的方式最有可能对mRNA产生干扰的lncRNA,由于此前采用生物信息学手段对lncRNA与mRNA结合的研究十分稀少,因此从mRNA角度出发,分析mRNA与其他RNA结合时的特征,结合lncRNA发挥作用的理论研究,构建本文的算法。本文通过对收集的mRNA与其他RNA结合的数据进行统计分析,提取了mRNA的新特征——与mRNA二级结构茎区重叠碱基个数占结合区域总碱基个数比例特征;并且将这一特征与mRNA被靶向时碱基配对稳定度特征、CG含量特征、连续碱基匹配特征相融合,构建特征打分模型。在二级结构对mRNA有着重要作用的基础上,提出基于二级结构的lncRNA对mRNA的干扰算法,将特征打分模型应用到算法中,算法的工作流程为:第一步采用动态规划方法构建mRNA和lncRNA的二维打分矩阵,筛选出所有符合要求的mRNA和lncRNA结合序列段;第二步通过特征打分模型对所有结合序列段进行处理,保存得分前10的lncRNA和mRNA结合序列段,作为候选序列段;第三步采用基于最小自由能原理的最近邻模型对候选序列段的能量进行计算,并且采用贪心算法选取10个候选基因中得分最高且能量最低的序列段;通过以上三步筛选出最有可能的mRNA和lncRNA结合序列段,那么也就筛选出了最有可能对该mRNA产生干扰的lncRNA。将合作单位提供的数据通过本文提出的算法进行处理,找到了对每个mRNA最可能产生干扰的lncRNA。合作单位通过生物手段进行预测结果进行验证,其中75%的mRNA确实受到了对应lncRNA的干扰。
其他文献
畜禽养殖业是我国农业经济的支柱产业,而由畜禽养殖废水导致的农业面源污染已经成为我国最大的污染源,NH_4+-N是畜禽养殖废水的主要污染物,氮素的去除作为环境领域的研究热点,生物脱氮以其处理成本低,效果好,无二次污染等特点被广泛应用。异养硝化-好氧反硝化细菌的出现,打破了反硝化作用只能在厌氧条件下发生的传统生物脱氮理论,使得硝化作用和反硝化作用均可在好氧条件下完成,具有提高脱氮效率和降低处理成本的潜
酰基肽水解酶(acylpeptide hydrolase, APH)可催化水解N端封闭的多肽,释放出N-酰化的氨基酸。由于APH受到有机磷(OP)化合物的抑制比乙酰胆碱酯酶更敏感,因此可作为阿尔茨海默氏病的
本文针对在数据分布不平衡环境下,分类模型难以对样本类别进行高效、精准预测的问题,进行了一系列的研究。首先,对经典的不平衡数据集分类算法进行了分析与总结,对本文所使用的相关知识以及模型评价指标进行了详细叙述。然后,从噪声样本角度考虑,将k近邻的思想引入到噪声样本的识别中,提出KNN噪声样本滤除算法。从过采样角度考虑,针对过采样算法中存在的不足,对SMOTE算法进行改良,提出了基于改进SMOTE的不平
花生四烯酸(ARA)是由亚油酸和亚麻酸等经过脱氢和碳链延长的反应合成,而此过程中△5脂肪酸脱氢酶可催化此反应,作为ARA合成途径中的限速酶,在反应中起到了脱饱和的作用。本研究采
NF-κB是机体内一种十分重要的核转录因子,与免疫反应、炎症和急性反应、细胞繁殖和凋亡、发育及肿瘤的发生密切相关,调控许多基因的转录表达。我们实验室通过生物信息检索查找
为提高寒冷地区沼气工程产沼气性能,本文以牛粪为原料,在低温(15℃、20℃和25℃)和中温(37℃)条件下进行了为期50天的序批式厌氧消化实验,研究了温度对沼气日产率、COD浓度和挥发性脂肪酸浓度等常规参数变化的影响,此外重点分析了中低温条件下厌氧消化过程中不同种类酶活性(纤维素酶、半纤维素酶、蛋白酶和淀粉酶)和微生物群落结构变化规律,以及对比不同温度条件下酶活性和微生物群落结构的差异,以期为提高
MoeGT1是参与莫诺霉素生物合成途径中的一个糖基转移酶,莫诺霉素属于磷酸糖脂类抗生素,可以与青霉素结合蛋白(PBPs)结合抑制转糖基酶的活性,使肽聚糖在细胞壁生长结点无法延伸,破坏
随着国家对环境民事公益诉讼的大力发展,环境民事公益诉讼案件不断增加,其主要承担责任方式就是损害赔偿,赔偿金额是否合理科学是环境民事公益诉讼现阶段发展需要关注的内容,文章旨在围绕我国环境民事公益诉讼损害赔偿问题展开研究,通过对损害赔偿范围和赔偿额的认定制度这两方面的立法现状和司法判例的梳理、归纳,在司法实践中发现在赔偿范围方面存在赔偿项目概念混淆、诉讼费用负担不合理、非使用价值损失未得到认可的问题,
生长激素受体(GHR)是一个单次跨膜蛋白,属于Ⅰ型细胞因子超家族,通过与生长激素(GH)结合而发挥其生物学功能;类胰岛素生长因子1(IGF-1)能显著改变正常人机体成分的分布,如脂肪减少、肌肉比重增高、体重增加等,主要以分泌方式作用于肌肉、骨骼等靶器官上的受体,进而调节动物生长发育。本试验以从江香猪为研究对象,运用分子克隆技术、序列比对分析、组织特异性表达检测、原代细胞培养、基因过表达和mRNA干
查尔酮合成酶(chalcone synthase,CHS)是黄酮类化合物合成途径中重要的聚酮合成酶。CHS以三分子丙二酰辅酶A和一分子香豆酰辅酶A为底物,生成查尔酮。查尔酮是合成花青素、黄酮