RNA亚细胞定位资源平台构建与文本挖掘工具开发

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:hejiashuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA(Ribonucleic Acid,核糖核酸)是生命体中不可或缺的分子,承担着传递遗传信息,调控转录过程和催化反应发生等的重要功能,其功能的行使与在细胞中的定位息息相关。当前是一个信息爆炸的时代,在各种科学技术发展的推动下,越来越多的生命科学数据呈现指数式的增长,RNA亚细胞定位(RNA subcellular localization)领域也不例外。如何在这些纷繁复杂的数据中快速找到对研究最有利用价值的信息,是这个时代丞待解决的问题。为了应对科研人员的海量数据检索及分析需求,本研究基于超文本标记语言(Hyper Text Markup Language,HTML)、层叠样式表(Cascading Style Sheets,CSS)、JavaScript(JS)、超文本预处理器(Hypertext Preprocessor,PHP)、MySQL数据库和Smarty模版引擎构建了包含查询、浏览、下载和分析等丰富功能的资源平台—RNALocate v2.0。与以往版本相比,2.0版本扩充了 RNA相关的综合信息,实现了对于不同来源数据的有效整合,设计了最合适的信息展示方式,并嵌入了三种基于序列的RNA亚细胞定位预测工具。依托该平台,研究者能够利用丰富的RNA亚细胞定位综合信息深入探索其功能机制。海量信息的收集与整理是资源平台更新和维护绕不开的一环。在数据飞速增长的时代背景下,仅仅依靠人工完成这项工作是不切实际的。为了满足这一现实需求,本研究同时开发了相应的文本挖掘(Text mining)工具。该工具采用深度学习模型Albert结合Stacking集成学习方法(Stacking ensemble learning method)的策略,实现对文本中RNA、亚细胞位置和疾病三类命名实体的识别,并完成相应互作信息的提取,满足了快速从文献中筛选关键信息的要求。综上所述,本研究成功构建了 RNA亚细胞定位综合信息资源平台,开发出了针对这一特定领域的文本挖掘工具。未来,该工具将成为平台更新的得力助手,平台也将为工具的优化提供数据基础。二者相互配合形成良性循环,帮助探索RNA的亚细胞定位与功能机制的奥秘。
其他文献
目前,日益增加的耐药菌已经对人类健康构成了严重的威胁。在此环境下,人们迫切需要新型的药物研发策略或者新型的抗菌手段来对抗病原菌。本论文基于新型的药物研发策略以及基于光动力治疗手段来开发新型的抗菌剂,并对它们的抗菌活性与机理进行研究。论文的工作分为三部分:第一部分:基于药效基团杂合的理念开发了 10个新型的1,3,4-噁二唑-2(3H)-诺氟沙星杂合体。体外抗菌实验表明大部分的杂合体对革兰阴、阳性菌
学位
癌症是世界范围内的主要公共卫生问题,被认为是全球人口的主要死因。喜树碱(Camptothecin,CPT)作为一种经典化疗药物,对多种肿瘤具有显著的抗增殖活性,应用前景十分广阔。然而,CPT水溶性差、缺乏选择性等缺陷严重限制了其临床应用。近年,大量新型药物递送系统被开发用于化疗药物的靶向运输,多肽-药物偶联物(Peptide-drug conjugates,PDCs)作为新型抗癌靶向疗法受到了广泛
学位
微/纳米马达是革命性的微型机器人系统,能够将包括光、超声和热能等在内的多种能量转换为机械动能。在这些驱动马达的方式中,光驱以其无线式传播、精准运动控制和高效驱动等优点已成为微/纳米马达研究的热点方向。尽管科研工作者们已经在包括显微外科和诊断在内的医学治疗中探索了光驱微/纳米马达的运动能力,但将其内在能量转化为生物电神经刺激和在生物组织内的可控穿透等方面仍未探索。针对以上的问题,本研究以光驱动微/纳
学位
砜类和喹啉类化合物是两种非常重要的有机化合物,在生物医药领域有着广泛的应用。亚磺酸钠和2-甲基喹啉分别是合成砜类化合物和喹啉类化合物重要的合成子。本论文进行了亚磺酸钠和2-甲基喹啉作为底物的合成方法学及产物的生物活性研究。论文内容分为以下三个部分:第一部分为亚磺酸钠作为底物的合成方法学和产物的生物活性研究。亚磺酸钠可参与反应合成砜类化合物,已报道的关于磺酰亚甲基氮杂环的合成方法存在许多不足,如金属
学位
在我国大多数地区,自行车作为方便快捷的交通工具仍被广泛使用着,自行车数量估计已拥有4多辆,每天平均600多万辆自行车在道路上行驶。由于自行车数量庞大,加上我国混合交通方式复杂、交通安全意识的薄弱、道路基础设施不完善等限制性因素,使得我国汽车-自行车交通事故高发。从事故受害方的角度分析,自行车使用者的伤亡率远高于机动车驾驶员,造成的负面影响较大。在司法鉴定区域,鉴定是否为骑行的委托较为常见,同时也是
学位
心肌梗死(Myocardial infarction,MI)是威胁国民、甚至世界人类健康的高致死率疾病之一,由其引发的心力衰竭更是全世界人类死亡的主要原因。组织工程心肌补片的提出和发展为MI的治疗提供了新的研究方向,并取得了一定的进展。然而,这种贴片的治疗潜力仍然受到材料毒性或低导电性的限制。其中,导电性直接影响细胞间电信号的耦合和传播。受动物界广泛存在的天然半导体材料黑色素(melanin)所启
学位
胃癌是全球第五大常见恶性肿瘤和第四大癌症死亡原因,调控其发生发展的机制复杂,且发病隐匿恶性程度高。因此,急需阐明胃癌发生发展的分子机制,并研发新的药物靶点治疗胃癌。Long-stranded non-coding RNAs nuclear-enriched abundant transcript 1(LncRNA NEAT1)定位于细胞核内,是paraspeckle(核旁斑)的骨架分子,作为长链非
学位
脓毒症(Sepsis)是宿主对感染反应失调而导致危及生命的器官功能障碍,严重时可发展成为脓毒症休克,甚至多器官功能衰竭。肝脏因为血运丰富,具有代谢、解毒和免疫等功能,使其成为在脓毒症中极易被炎症因子损伤的靶器官之一。肝功能障碍将影响脓毒症患者的预后。脓毒症时炎性细胞如巨噬细胞等被过度激活,使炎症因子如白介素-6(Interleukin-6,IL-6)、白介素-1β(Interleukin-1β,I
学位
越来越多证据表明许多lncRNA能和基因近端和远端的DNA序列特异性结合形成RNA:DNA Triplex,这种结合使得lncRNA能够把组蛋白和DNA修饰酶招募到结合位点附近,进而通过表观基因组修饰调控基因的表达。目前已经有多个预测lncRNA/DNA结合的工具,但是在全基因组范围实现快速且准确的预测仍是一个挑战,缺乏在耗时和准确性两方面皆令人满意的工具。为此,基于前期工作,我们开发了两个预测工
学位
研究背景传统RNA领域研究根据其是否具有蛋白质编码能力,将RNA分类为信使RNA(messenger RNA,mRNA)或非编码 RNA(non-coding RNA,ncRNA)。然而最近有研究表明,在动物、植物和细菌中发现了一类非常规RNA,其既可以具有mRNA的蛋白质编码能力,又具有ncRNA的调控功能,此类同时具有编码蛋白质和非编码功能的RNA被称为“双功能RNA(dual-functio
学位