【摘 要】
:
随着医疗科技的发展,大规模生物数据库的建设以及基因测序能力的大幅提升,产生了海量的生物医学数据。在积累生物实验数据的同时,也积累了大量的非结构化文献数据。对文献数
论文部分内容阅读
随着医疗科技的发展,大规模生物数据库的建设以及基因测序能力的大幅提升,产生了海量的生物医学数据。在积累生物实验数据的同时,也积累了大量的非结构化文献数据。对文献数据进行整合分析,从中提炼出更多的生物医学信息,有助于了解疾病发生发展的机制和过程,促进疾病的诊治。传统的手工分析和注释的方法已经难以适应快速的文献增长,国内外已经有越来越多研究者关注文献挖掘方法的研究。现有方法多是基于“共现”原则,结合自然语言处理的方法进行语义分析和语法处理,一定程度上限制“潜在”关系挖掘和待分析文章数量。且研究对象主要集中在疾病层次,目前还没有比较权威的针对一种特定的肿瘤疾病,综合现有文献数据,挖掘疾病相关临床术语与基因潜在关系的研究。因此,本论文提出一种潜在关联分析的文献挖掘方法。并针对典型肿瘤疾病结直肠癌,以促进肿瘤精准防治为目标,将方法应用到结直肠癌临床-组学关系挖掘中,并结合生物医学知识,对挖掘结果进行深入探究和分析。具体工作如下:提出一种基于MeSH主题词的文献挖掘方法,能够将复杂的关联分析转化为矢量间的数学运算,实现定量分析,同时避免“共现”原则带来的限制,为潜在关系挖掘提供一种新的思路;选取结直肠癌为研究对象,将本文提出方法应用于结直肠癌临床-组学关系挖掘。并结合组学分析工具等,对挖掘得到的结果进行分析和解释。提出MTA1-perineural invasion(嗜神经性侵袭,肿瘤恶化标志)等潜在临床-组学关系,为结直肠癌基础研究提供参考;构建结直肠癌临床-组学关联知识共享平台,提供挖掘结果的查询、下载等功能,实现数据分享与方法重用。结果表明,基于MeSH主题词的文献挖掘方法为疾病临床-组学关系挖掘提供一种新的思路,也可用于其他疾病的研究和分析中。
其他文献
为了分析中国菠萝出口的市场环境,提升中国菠萝产品的国际市场占有率,在全面分析鲜或干菠萝、其他制作或保藏菠萝以及菠萝汁三类菠萝产品的出口贸易量、出口贸易额的基础上,
目的:研究中老年健康人糖化血红蛋白临床数据的规律。方法:选择2013年2月~2014年8月来某院进行常规查体的健康中老年人,根据性别分为男性组324例(A组),女性组312例(B组)。使
通过划定临水控制线和外缘控制线明确河道岸线范围,根据岸线开发利用现状、经济社会发展对岸线利用的需求及河流生态环境的需求,对各河段岸线进行功能划分。通过河道岸线利用与
目的探讨超声血管增强技术(VET)在布--加综合征诊断及介入治疗中的应用效果。方法选择布-加综合征患者36例,分别采用二维及彩色多普勒超声检查,比较分析其诊断符合率及声像图表现
目的:观察宫颈上皮内瘤变(cervical intraepithelial neoplasia,CIN)患者宫颈脱落细胞中多肿瘤抑制因子P16(P16)和增殖细胞核抗原Ki67(Ki67)的表达,分析各样本中二者表达水平
综述了苯酚主要的生产工艺,尤其对主流的异丙基法工艺进行了详细地介绍和分析。重点关注了目前苯酚生产技术的最新进展,探讨了环己基苯法、苯直接氧化法、生物法等新工艺的开
目的:探讨岭南人群的经络虚实特征。方法:采用经络检测仪,检测1 126名岭南健康人群的十二经脉特定五输穴电阻,通过经络检测仪配套软件将检测电阻值转换为经络能量柱状图,分析
随着以GaN为代表的宽禁带半导体材料的发展,高功率密度电子元器件在军用电子装备上得到更为广泛的应用。军用电子装备的功率密度越来越大,对散热技术的要求也越来越高。文章
主要介绍了放射性基本知识、建筑保温材料放射性的危害,并且详细介绍了建筑保温材料放射性测试方法及主要指标计算方法。通过分析常用建筑保温材料的内外照射指数,进一步说明
硫酸亚铁铵(FeSO4.〈NH4〉2SO4.6H2O),俗名莫尔盐(Mohr’s salt),是一种复盐,其外观为透明浅蓝绿色单斜晶体,在空气中比一般盐稳定,不易被氧化,是一种常见的净水剂、防腐剂,