基于科研文献挖掘的疾病与药物关联研究

来源 :山西医科大学 | 被引量 : 4次 | 上传用户:bingfeng615404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:生物医学实体是包含在医学科研文献中出现的疾病、药物、基因等名称、术语或概念,即一种文献内含知识,了解其相互关联对于科学研究意义重大。然此类知识被大量淹没于文献海洋,亟需一种有效知识管理方式将之快速地展现给科研人员。鉴于此,本研究拟基于科研文献挖掘开展疾病与药物实体关联研究。方法:1.文献分析法通过搜集、鉴别、整理相关文献,分析当前国内外相关研究历史、现状及存在的问题。在阅读、整理、归纳、分析这些文献材料的基础上,借鉴他人的研究成果,从而形成自己的研究框架。2.编程语言和数据库技术利用Java和Python等程序设计语言和数据库技术将上述PubMed ID相关的文献信息下载,进行批量数据有序化,并在MySQL数据库中分别建库。3.生物实体识别方法使用基于词典的匹配方法识别疾病实体与药物实体。4.信息计量学方法利用Python自编程序语言,基于信息计量学中的共现关系构建疾病与药物实体共现网络,并运用词频分析和共词分析进行疾病与药物实体关联分析。5.社会网络分析方法利用社会网络分析工具Pajek对共现网络进行宏观和微观层次的指标分析。微观指标层次进行中心度(点度中心度、接近中心度、中介中心度)等指标的对比分析。最后利用Gephi对共现网络进行可视化分析。结果与结论:本研究所使用的生物医学实体识别及关联发现方法能够帮助科研人员从大规模的生物医学文本中快速探测被隐藏的关联,具有良好的推广性,也同样适用于疾病-基因、基因-药物等其他生物医学实体之间的分析。
其他文献
20世纪50年代,前苏联在世界上首先成功发射了第一枚洲际弹道导弹,不久又成功发射了第一颗人造地球卫星,连续创下了军事技术发展史上的两项世界第一。这两项世界第一的总设计师就
近50年来全球气候变化研究已经是当今自然科学重大课题之一,中国的区域响应也日渐引人关注。依据黑龙江、新疆、西藏三省区93个国家基准或基本气象站1961—2008年间的日气温
商水县境内应用广泛的地面灌溉技术,通过平整土地、改进沟畦灌规格和技术要素来提高水利用效率,小畦灌是商水县广大农村地区一项行之有效的田间节水灌溉技术,在商水县境内有
村镇银行作为新型农村金融组织的一支中坚力量,成长时间不长,发展尚不够充分,尤其是随着村镇银行试点的大范围铺开以及金融创新力度的不断加大,金融风险管理问题日益成为村镇
研究了预氧化一化学沉淀法对水中砷的去除效果及其影响因素。结果表明,原水砷质量浓度为5倍标准限值时,在NaClO预氧化条件下,投加8mg/L的聚合氯化铝可使砷去除率达到84%,且出水砷含
信息时代正在到来,农业经济信息对"三农"的影响日益加深,而信息的有效采用,关系到农业增效、农民增收、农村稳定.文章提出的采集信息时要注意的几个问题值得引起注意.
日前,中国新兴集团总经理于敦才收到了一封特殊的感谢信,这封来自中南海的感谢信,由中直管理局、中办秘书局和中南海电信局三家单位的领导亲自登门送来,以示他们对该集团圆满
期刊
培养外国留学生良好的汉语学习习惯是对外汉语教学中不容忽视的一部分。通过对东北师范大学国际汉学院留学生的学习习惯进行调查,将调查结果的数据具体整理分析,发现了留学生
在湖北蕨类植物区系中,属种数量最多的科有水龙骨科(Polypodiaceae)、鳞毛蕨科(Dryopteridaceae)和蹄盖蕨科(Athyriaceae)。并以鳞毛蕨属(Dryopteris)、耳蕨属(Polystichum)
目的:观察悬吊运动治疗(sling exercise therapy,SET)系统悬吊治疗对脑性瘫痪儿童智能发育的影响。方法:40例6岁以下的脑性瘫痪儿童纳入本研究。根据随机数字表法分为治疗组