论文部分内容阅读
目的:在系统整理岭南灸法古籍的基础上,本研究建立岭南灸法电子数据库,从岭南灸法古籍的研究现状出发,探讨适合针灸学古籍的知识表示方法;尝试用本体语义网络技术实现知识的结构化表达,为知识复用提供基础;将本体以语义关系图进行可视化展示,以发现潜在规律;搭建语义检索系统,尝试运用本体进行语义检索的联想和推荐,以满足临床针灸医生或针灸古籍研究者的检索需求。方法:1.文献研究首先对岭南灸法古籍的研究现状进行综述。列举岭南历代灸法代表医家及著作,结合专家建议和文献研究结论确定岭南灸法知识源古籍范围。比较岭南灸法的代表著作,提出《采艾编翼》较完善地展示了医家的意象世界。其次通过对7种知识表示方法的综述和对比,确定本体是最适合用于岭南灸法古籍知识表示的方法。随后对本体在中医学领域的应用进行了综述,介绍了中医学领域顶层本体的构建和细分领域的本体研究及进展。最后通过古籍电子数据库查找、纸质版影印后OCR识别、人工校对等方式,完成古籍的电子化,建立岭南灸法古籍电子库。2.语义学分析本研究采用形式分类方法对岭南灸法古籍包含的知识进行分析。对岭南灸法古籍进行语义学分析,对其中词组、短句涉及的特殊语言现象进行整理,重点分析其中的多元语义关系。在语义学研究基础上,采用人工提取的方法对岭南灸法古籍进行概念提取,参考《中医大辞典》进行概念的规范化,整理《标准词库》并与专家讨论确认。从核心概念出发分析概念之间可能存在的关系。3.本体构建及可视化采用七步法构建岭南灸法古籍本体,使用Protege软件实现构建。首先确定本体构建的目标和范围;其次研究领域顶层本体TCMLS与岭南灸法古籍本体之间的关系;确定本体中的类和关系,采用自顶向下的方法逐层构建本体。从《采艾编翼》原文逐句解析语义,添加本体中的实例。对实例添加中的特殊情况,如类与实例重名、实例属于不同的类、互文、别名、通假等情况制定处理方案。记录实例构建中未解决的问题。将别名整理到《同义词库》,用于检索系统。本体构建完成后,对本体的一致性进行检验。采用OntoGraf插件实现语义关系可视化。4.基于本体的语义检索实现搭建基于Java和HTML的本体语义检索模型。使用HP实验室的Jena开发包解析本体,得到三元组规则。将使用者检索的关键词生成SPARQL语句,在知识库中进行匹配,在检索页面展示匹配到的结果以实现基于领域知识的语义联想。允许用户选择联想到的词,在古籍库中查询所选词及其同义词,在页面返回结果。结果中经过标注的段落作为推荐内容展示在最上方。5.岭南灸法的知识发现通过本体的语义关系图实现岭南灸法知识的结构化表达。对“痫”进行本体内检索,可全局性地展示“痫”病证的病名内涵、主治穴位和鉴别诊断思路。对“中风”进行本体内检索,发现其概念内涵与现代针灸学理论中的“中风病”存在差异。对特定穴进行检索,发现岭南灸法中特定穴的主治范畴与现代针灸理论有所不同,如“太渊治疗目疾”,“太溪治疗气疝、水痛”等。在本研究搭建的检索系统中检索“热症”,系统通过“病-症-穴”的核心关系联想到热症的症状和穴位,通过标注和知识库匹配关联到原文。结合症状的分布和原文语义分析“热症”的辨治和选穴思路。检索“神昏”,对系统联想到的治疗“神昏”的穴位进行总结。结果:建立岭南灸法古籍电子知识库,完成岭南灸法古籍的本体构建,包含408个类、43个属性(37个对象属性和6个数据属性)、814个实例和4077条公理。用本体实现了岭南灸法知识的结构化表示;搭建基于领域知识的检索系统,初步实现语义联想和原文检索的语义推荐。总结了岭南灸法中“痫”的辨治思路。发现岭南灸法中特定穴的运用独具特色。发现岭南灸法中“中风”的概念包含“心中风”和“腹中风”。与医生临床需求相关的结论:实现“热症”的“病-症-穴”联想和原文推荐;发现岭南灸法治疗“热症”先辨“无汗”和“有汗”两个方向,前者选穴以发汗解表为主,后者选穴以清热、养阴、化痰为主。“热症”取穴以手少阳三焦经和手厥阴心包经为主。岭南灸法治疗“神昏”选穴不限于具备开窍醒神或温阳作用穴位,如昆仑、肓俞、大敦、间使等。结论:1.本体技术可实现中医地域性医学或流派的知识表示,中医学细分领域知识的本体化有助于信息加工和重用;2.本体可视化在一定程度上能展现辨证思路、鉴别诊断思维等针灸学古籍中的隐性知识,为知识发现提供帮助;3.基于本体的检索系统可对岭南灸法专业内容进行联想和推荐,有助于研究者更高效地发现古籍原文中的规律;4.运用本体和本研究搭建的检索系统所发现的岭南灸法古籍隐性知识,与文献综述总结的岭南灸法“热症用灸”、“艾灸醒神不唯温阳”的特色具有一致性。