基于依存分析的妇科疾病知识图谱构建与应用研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:shazi009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今的妇科病患病率愈来愈高,年龄愈来愈低。随着人们更加注重自身健康管理,互联网中医学相关服务和网站也随之增多,海量的医学数据不断产生。如何整合互联网和医学文献中专业医学知识成医学知识图谱,为妇科患者提供优质的诊断服务成为了关键问题。在众多知识表示方式中,知识图谱作为一种语义网络拥有极强的表达能力和建模灵活性,而知识图谱构架的前提则是知识的建模。论文基本思路,围绕妇产科学知识进行妇科知识特征的抽取,构建领域知识模型框架和表示形式。根据网页树结构特点制定知识抽取规则,实现半结构化知识的自动抽取;以Skip-gram模型为基础采用依存分析实现领域非结构化知识自动抽取;最终,通过原型系统完成图谱构建以及实现知识的搜索。本文主要工作如下:(1)本文基于医学文献和临床实践思维深入分析了妇产科领域的知识特征,围绕疾病抽取了症状、病因、治疗等六个维度实体,并对六个维度实体之间的相关信息进行了关系建模,构建了妇科疾病领域知识模型框架。(2)通常使用正则表达式方法对半结构化文本的知识进行抽取以获取目标节点,影响抽取效率的主要原因是不同的节点内容对应不同的正则表达式。文中采用了Xpath路径归纳方法来提高抽取效率,其原理是采用抽取规则集中抽取目标节点,通过避免反复的抽取过程来提高抽取效率。首先计算目标节点的Xpath之间最小编辑距离,接着基于网页树结构采用动态规划方法将所有Xpath距离进行整合,最终形成抽取规则。(3)由于医学文献中不同的疾病会存在相同的症状,传统Skip-gram词向量模型无法有效判断抽取的症状是否属于同类疾病,导致疾病相关信息不完整。针对上述问题,通过对医学文本依存分析来制定加权方案,在传统的Skip-gram词向量模型基础上置入加权依赖矩阵,进一步强化抽取信息的上下文指向性,使得抽取同类疾病的信息更全面。本文对四种常见疾病进行知识抽取,实验结果表明,该方法更准确的识别同类疾病相关信息,从而提升知识抽取的完整性。(4)在Neo4j图形数据库搭建平台基础上,进行原型系统分析和总体架构设计,使用cypher语言实现对图数据的基本操作,最终完成妇科知识图谱原型系统搭建,通过对功能模块进行场景应用,验证论文工作的有效性。
其他文献
近年来,我国各行各业对用水量的需求日益增加,水资源环境受到了严重挑战。政府对日常的水质监测任务提出了更高的要求,由过去的人工采样水质到如今使用无人船来进行水质监测,而无人船在未知水域中行驶需要考虑障碍物的影响。我国在无人船系统及其避障算法的研究尚处于起步发展阶段,同时也取得了一些实质性的进展,这一技术成为了现如今的研究热点。本文在分析国内外的无人船避障系统相关研究的基础上,设计了一种基于改进型AP
工业文明日渐繁荣,水体污染问题也逐渐暴露在人们眼前,制约社会的发展,威胁人类的健康。酚类化合物是水体污染中最难降解的成分之一,对硝基苯酚和双酚A就是其中的代表。如何对二者进行有效降解,牵动着研究者的心弦。环糊精和二氧化钛价格低廉、来源广泛,在吸附剂领域研究十分广泛。但现有的吸附剂在二次使用过程,大多需要使用大量的有机溶剂淋洗,二氧化钛在光催化降解过程中易团聚。本文针对以上问题用分子印迹法将环糊精吸
随着愈加严格的排放法规不断更新与实施,汽油车的整体排放大幅降低。但是GDI发动机在冷起动等工况下,由于缸内温度较低,燃油蒸发雾化困难、油气混合不均匀,易出现湿壁现象,造成排放恶劣等问题。因此,研究冷起动阶段燃油的蒸发与混合气形成特性,对进一步提升GDI发动机的性能具有重要意义。米勒循环作为近年来GDI发动机高效清洁的主要措施之一,主要应用于中低负荷工况。由于进气门晚关米勒循环使缸内温度降低,会进一
安全生产是建设工程的“生命线”,同时也是项目质量安全的“晴雨表”,其重要性不言而喻。《中国人民共和国建筑法》规定了建设工程必须实行工程监理制度,建设单位分别需将工程任务(安全及生产)、监督管理(安全及生产监管)任务委托于施工单位(总承包商、分包商)、监理单位,才能正式开展施工工作。由此,建设工程形成了主要以施工单位内部控制和监理单位外部约束为主的安全生产管理方式。理论上,建设工程安全生产双重保障机
建筑耗能和秸干焚烧引起的环境问题,都是当今社会关注和研究的热点,也是急需解决的社会难题。建筑耗能占世界能源消耗的30%到40%,建筑业也造成了全球35%的温室气体排放。水稻种植每年生产大量的稻秆,据估计全球秸秆年产量约为7.409~1.1114亿吨。然而,只有一小部分稻秸秆被有效利用,大量的稻秆被丢弃在田间或直接焚烧,不仅对生物质资源造成了巨大的浪费,还造成了严重的污染。本研究在上述大背景下,利用
在我国,小麦产量占粮食产量约1/5,但小麦在运输和储存过程中极易发霉,甚至产生毒素,尤其是黄曲霉毒素。亟需建立一套成熟的感染黄曲霉产毒菌小麦霉变程度早期检测方法。本研究以黄曲霉毒素主要来源之产毒黄曲霉与不产毒黄曲霉感染小麦为研究对象,采用复合纳米色敏传感器技术,建立一种用于早期检测感染黄曲霉产毒菌小麦霉变程度的方法,具体研究内容如下:(1)黄曲霉产毒菌产毒规律分析。实验采用国标方法同位素稀释液相色
本文的研究在国家自然科学基金“含沙水条件下水力机械空化特性及磨蚀机理研究”(项目编号:51979126)的资助下展开。离心泵广泛应用于黄河流域,在输送混合多种粒径泥沙的水流时,泥沙颗粒的存在会与过流壁面发生摩擦碰撞,造成其磨损破坏,严重影响离心泵运行的稳定性与使用寿命。针对离心泵磨损问题,本文以离心泵为研究对象,通过试验与数值模拟的方法,研究了流量、泥沙浓度与泥沙颗粒物性等对离心泵过流部件磨损的影
PVDF是一种重复单位为[CH2-CF2]n-的半结晶聚合物,其本身具有优异的压电性、生物相容性及高表面积,能够负载抗菌剂制备成复合薄膜。薄膜可将抗菌药物输送到伤口部位以控制感染,其本身的压电性对细菌活性也具有一定影响。本文采用3D打印制备PVDF复合薄膜,通过改变辅助电压,PVDF的质量分数等参数,探讨打印参数对薄膜制备的影响,选取最合适的打印参数;通过负载多种抗菌剂,以大肠杆菌为检测菌种,探究
随着农业信息化与智能化发展,图像拼接技术在农田作物监测、喷雾机器人作业等方面起到重要作用。传统的图像拼接方法存在拼接速度慢、匹配准确率低、重影等问题。为了解决这些问题,本文利用植株的彩色和深度双源信息,研究了喷雾机器人靶标图像的准确快速拼接方法,主要研究内容总结如下:(1)设计了喷雾机器人靶标图像拼接的实验平台。根据靶标图像拼接需求,在喷雾机整机结构的基础上,配置了RGB-D传感器、微型嵌入式计算
硅氧化物负极材料被认为是下一代商业锂离子电池中极具应用前景的负极材料之一。本文针对非化学计量比硅氧化物负极材料在充放电过程中的体积效应比较严重,长时间循环后会造成材料发生粉化和破碎,导致循环寿命急速下降,以及其本征电子电导率较差的问题提出了无定形碳和Li3BO3双重包覆、采用CNTs与金属锡构建三维导电网络结构、制备Ni-MOF多孔材料来改善材料的循环稳定性和倍率性能,主要结果如下:(1)采用改进