论文部分内容阅读
随着科技的快速发展,医学文献数据呈井喷式增长,从庞大的数据中挖掘有效的医学知识并支持临床决策的相关研究已成为一个重要研究领域,而药物推荐是其中一个重要的研究方向。药物推荐算法可以分为基于药物的推荐算法和基于疾病的推荐算法。在基于药物的推荐算法中,本研究针对特征抽取不足,特征处理不科学等问题提出基于文本挖掘的药物相互作用关系抽取方法;在基于疾病的推荐算法中,挖掘文本中药物之间是否存在组合关系,提出基于异构信息网络的组合药物推荐算法,本文研究的主要工作包括以下三个部分:(1)基于文本挖掘的药物相互作用关系抽取方法。本研究对已有的药物相互作用关系抽取方法进行了研究并改进,本文针对特征抽取不全面,特征处理不科学等不足,提出基于文本挖掘的药物相互作用抽取方法,该方法需要抽取特征,处理特征和分类三个部分。在抽取特征部分,加入关键词等特征;在特征处理部分,利用词向量对特征进行量化;在分类部分,针对不同的分类阶段采用不同的分类模型。实验表明:在相同的数据集中,本文的抽取方法的性能优于其他方法。(2)基于异构信息网络的组合药物推荐算法Com-MedRank。本研究对从医学文献库MEDLINE中发现有效降压药物的HIC-MedRank算法进行了研究并改进,本研究对原算法中未考虑药物之间的关系进行改进,提出了基于异构信息网络的组合药物推荐算法Com-MedRank,该算法利用文本挖掘判断药物之间的关系是否为组合关系,对HIC-MedRank的输入进行修改。本文以高血压作为实验输入,降压组合药物作为实验输出,为临床医生推荐组合药物。(3)药物推荐系统的实现。本文采用Java WEB框架和JUNG工具来实现该系统。本系统主要分为两个模块:药物相互作用关系推荐模块和基于疾病的药物推荐模块。在药物相互作用关系推荐模块中,用户输入一个药物,系统会挖掘出与该药物发生相互作用关系的药物及其相互作用类别;在基于疾病的药物推荐模块,用户通过疾病关键词获取该疾病基于医学文献的Top-10的推荐药物列表。在这两个模块中,系统都会利用JUNG工具包对网络进行可视化。本系统已通过所有测试用例,达到了上线要求。