面向文摘的中药方剂与疾病关系抽取研究

来源 :湖北中医药大学 | 被引量 : 0次 | 上传用户:scorpiokyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的利用中国知网网络期刊数据库的中医药类型文献摘要数据,结合自然语言处理、机器学习与深度学习等方法,对中药方剂与疾病之间的关系进行抽取,并对关系抽取的结果进行可视化展示。方法使用Web爬虫技术自动获取中国知网的文献摘要数据,并对其进行数据清洗、构建词典、分词等预处理,然后使用两种目前最流行的方法对中药方剂与疾病的关系抽取方案进行对比研究。第一种方法首先对清洗整理后的文献摘要数据进行特征提取,再构建SVM分类模型;第二种方法无须人工提取特征,结合LSTM模型直接使用Word2Vec训练词向量。由于文献摘要数据量较大,为提高数据处理效率,在进行关系抽取时探索使用Spark分布式计算平台执行计算任务。关系抽取的结果保存在非关系型数据库中,并对结果进行网页展示,采用JSON数据格式进行前后台数据交互,借助D3.js技术在Web前端进行可视化展示。结果使用Web爬虫技术,共获取中国知网从1950年到2016年,“文献分类目录”下“医药卫生科技”—“中医学”类别的所有摘要数据,共计1073581篇摘要,根据中药方剂与疾病词典筛选出同时包含中药方剂与疾病的语句共204780句。第一种方法构建的SVM分类模型,准确率达87%;第二种方法结合Word2Vec训练的词向量,构建的LSTM模型,其准确率基本上保持在85%--87.5%之间,与使用SVM模型的准确率基本一致。在第一种方法中使用Spark分布式计算平台执行计算任务,显著提高了运行速度。将中药方剂与疾病之间的关系抽取结果存储在MongoDB非关系型数据库中,借助D3.js,结合Spring Boot后台与Vue.js前端框架制作可视化展示系统,可在浏览器中对关系抽取的结果进行动态展示与查询。结论利用机器学习方法与深度学习方法对中国知网中医药文献摘要文本数据进行关系抽取,准确率较高,得到的中药方剂与疾病关系三元组,将对中药方剂治疗疾病研究起积极推动作用。中药方剂与疾病关系抽取结果的可视化展示系统,有助于中医药研究人员进行快速检索。
其他文献
主要通过对路易斯康的萨克尔生物研究所设计的部分草图和构思的介绍,了解建造时间、背景、艺术风格、结构和构造方式,回归到路易斯康对新纪念主义在该项目上的具体思考和体现
"研究性学习"课该怎么上,是数学教师普遍的困惑。从教材中的探究案例"港口水深的变化与三角函数"入手,引导学生展开一次"研究性学习",并在实施的过程中,引导学生不断深入,不
目的 观察环孢素A联合雄激素治疗慢性再生障碍性贫血的疗效。方法 选取再生障碍性贫血患者20例,将其按照随机方式分为对照组和观察组,各10例。对照组采取常规治疗方法治疗,观察
随着全球人口老龄化,骨质疏松症和骨质疏松性骨折的患病率将持续增高,已成为全球共同关注的健康问题。如何早期、全面、无创评价骨质量及预测骨强度,预防骨质疏松脆性骨折正
CPFS理论指出,数学命题教学应该帮助学生增加命题数量,丰富命题之间的联系。余弦定理教学中,可以利用全等三角形的知识,引出推导需求;联系锐角三角函数定义、勾股定理、射影
目的:探讨SOX与FOLFOX6化疗方案治疗老年晚期胃癌患者的临床疗效。方法:选择2009年10月~2014年10月本院收治的老年晚期胃癌患者共80例,按照随机数字表法随机分为实验组和对照
目的:三层共挤输液用袋是高风险的输液类药品包装容器,本研究建立三层共挤输液用袋中添加剂(抗氧剂及铝、镁元素)的含量测定方法并对添加剂的迁移量进行考察。方法:采用欧洲药
<正>责任意识是社会个体必须具有的基本道德元素。"各自责,则天清地宁,各相责,则天翻地覆",对责任的论说和强调一直是儒家思想倡导的主要内容。无论是"士不可以不弘毅,任重而
目的 探讨对外伤性尿道断裂患者的处理方法以及处理效果。方法 选择54例外伤性尿道断裂患者为研究对象,其中有9例患者为不全性尿道断裂,45例患者为完全性尿道断裂,两种不同的
目的 探讨和分析数字化乳腺钼靶摄影技术。方法 选择行乳腺钼靶X线检查的125例乳头溢液、乳房疼痛、乳腺肿块患者为研究对象,回顾性分析患者的临床资料。结果 125例患者中有1