利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究

来源 :China’s foreign Trade·下半月 | 被引量 : 0次 | 上传用户:gbyljk008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】 介绍了数据挖掘的意义和任务, 应用数据挖掘中的关联规则分析技术,挖掘李佃贵教授治疗慢性萎缩性胃炎的临床思想,进而探索李佃贵教授的遣方用药的变化与思路。揭示名老中医遣方用药规律,为慢性萎缩性胃炎的研究提供新思路、新方法,为临床遣方用药提供新的思维模式和决策依据。
  【关键词】 数据挖掘 关联规则 置信度 李佃贵 慢性萎缩性胃炎
  本文主要是对中医药研究中所涉及到的数据挖掘方法进行分析研究,在中医的科研中 ,无论是临床、实验和文献的研究中都可能遇到需要进行数据分析的情况 ,初级的分析方法已很难再适应科学发展的需要,掌握好数据挖掘的思路和方法,对中医科研的进步应该是大有裨益。借助数据挖掘技术继承和发展中医学,数据挖掘技术的发展不但使我们从这些海量数据中发现新的知识,发现数据背后隐藏的关系和规则,还可以对未知的情况进行预测。
  1. 数据挖掘介绍
  1.1数据挖掘
  数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘中的原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。数据挖掘可以按数据库的类型、挖掘对象、挖掘任务、挖掘方法与技术几个方面进行分类。按数据挖掘任务分类数据挖掘的任务有:关联分析、时序模式、聚类、分类、偏差监测、预测等。按任务分类可将数据挖掘分为:关联规则挖掘、序列模式挖掘、聚类数据挖掘、分类数据挖掘、偏差分析挖掘和预测挖掘等类型。
  1.2关联规则
  挖掘李佃贵教授治疗慢性萎缩性胃炎医案的方法是关联分析。关联规则其实就是为了确定数据对象间相关性,从中找到出现条件概率较高的模式。通过搜索事务数据库中的所有事物,寻找所有能将一组数据项和另一组数据项相联系的规则。而这种规则的建立是以一定置信度、支持度作为限制条件的。若两项或多项属性之间存在关联,则其中项的属性值就可以依据其他属性值进行预测,找出数据库中隐藏的关联关系,从而指导制定决策。
  关联规则挖掘算法:关联规则是描述数据之间存在关系的规则,形式为“A1∧A2∧…An→B1∧B2∧…Bn”。一般分為两个步骤:① 求出大数据项集。②用大数据项集产生关联规则。数据挖掘是一个复杂的过程,它的一般步骤是:分析问题->提取、清洗和校验数据->创建和调试模型->查询数据挖掘模型的数据->维护数据挖掘模型。
  1.3技术路线
  本课题是研究李佃贵教授辨治慢性萎缩性胃炎医案,结合医案中的症状、用药等信息以及中医药先验知识,运用数据挖掘技术归纳出医案中处方的功效。本文设计了一种新的处方功效分析思路:数据挖掘中的关联规则技术用于药物配伍分析,其有独特的作用。方剂数据挖掘在过程上可分三个阶段: 数据准备、数据挖掘、结果表达。
  2. 数据挖掘在中医药中的应用
  目前运用于方剂研究的数据挖掘方法取得了不少的成果,对中医药理论研究和方剂理论研究起到巨大的推动作用。在数据挖掘技术方面,确定方剂中各种药材之间的关联关系,结合统计学原理以及数据挖掘技术,分析各种病症与各种方剂之间的关系,最终起到医疗辅助决策的作用。
  本研究把数据挖掘技术应用于李佃贵教授辨治慢性萎缩性胃炎医案的分析中。探讨名中医治疗慢性萎缩性胃炎的处方用药规律,了解其遣方用药的变化与思路,对科学筛选临床有效的方药,为学习提供借鉴,提高临床治疗水平有十分积极的意义。同时加深对医家的了解, 验证其学术思想也有不少裨益。
  3. 慢性萎缩性胃炎医案关联规则挖掘分析
  关联规则挖掘可以发现存在于数据库中的项目或属性间的有趣关系,这些关系是预先未知的或者被隐藏的。一般使用置信度(confidence)来描述关联规则的属性。置信度定义:规则 X => Y在事务集中的置信度(confidence)是指同时包含 X ,Y 的事务数与包含 X 的事务数之比,它用来衡量关联规则的可信程度。记为:confidence( X=>Y)=support(X)\support(X ∪Y)。一般情况下,只有关联规则的置信度大于期望可信度,才说明X的出现对Y的出现有促进作用,也说明了它们之间的某种程度的相关性。
  3.1原始数据来源与预处理
  原始数据的特点是具备关联性。在临床调研中,发现症状与用药之间都有一定的关联性。而且这些关联性正是临床医生辨证论治的经验,单从一两个病号数据里是不容易发掘这些经验的,必须借助于数据挖掘技术。数据预处理是数据挖掘中的一个重要环节,对实验数据是否妥当处理将直接关系到挖掘结果的质量,采用计算机来处理这些大量复杂的数据,提高了效率。对李佃贵教授治疗慢性萎缩性胃炎医案进行采集、整理,录入数据库中。李佃贵教授2008年10月~2011年6月在河北省中医院与河北省中医药研究院医院门诊诊治的慢性萎缩性胃炎患者,其病例内容在李佃贵教授的当场指导下记录。本研究共纳入门诊病例120 份。病历都由“病历序号、患者基本信息包括患者的性别以及年龄、患者所有的症状、辨证、处方”几部分组成。首先进行数据规范化,症状、药材都有了统一的名称。其次,进行数据数值化,用文字描述的数据不利于计算机接收和处理,而用数字表达则可以大大的简化工作的复杂度。
  3.2关联推理
  慢性萎缩性胃炎临床表现缺乏特异性,而且与病变程度并不完全一致。临床上,有些慢性萎缩性胃炎患者可无明显症状。通过对120份病例统计分析,慢性萎缩性胃炎临床症状主要有:胃脘胀满(66次)、胃脘疼痛(42次)、胃脘不适(6次)、胁肋胀满(10次)、后背疼痛(13次)、嗳气(50次)、呃逆(1次)、烧心(32次)、恶心(9次)、反酸(21次)、乏力(17次)、心烦(6次)、善太息(3次)、咽部不适(12次)、口干(33次)、口苦(20次)、口中粘腻(5次)、口中异味(5次)、怕冷(4次)、舌痛(4次)、纳差(29次)、不寐(19次)、头晕(10次)、小便黄(7次)、大便黏腻不爽(33次)、大便干(17次)等。舌质以黯红舌( 84次) 为主,舌苔以黄苔( 71次) 、( 厚) 腻苔( 14次) 、白苔( 35次) 为主。脉象多呈弦象,见脉沉弦( 53次) 、脉弦滑( 28次) 、脉沉弦细( 10次) 、脉细( 29次) 等。   根据统计结果,按照出现频次从多到少的顺序,排在前十位的临床症状分别是:胃脘胀满(66次)、嗳气(50次)、胃脘疼痛(42 次)、大便黏腻不爽(33次)、口干(33次)、烧心(32次)、纳差(29次)、反酸(21次)、口苦(20次)、不寐(19次),这与李佃贵教授总结的慢性萎缩性胃炎“痛、胀、痞、满、呆、嗳、烧、酸、泻、秘”十症基本相符。排在前两位的临床症状分别为:胃脘胀满、嗳气,而胃脘胀满、胃脘不适两个症状共计出现72次,这一主要症状与目前将慢性萎缩性胃炎归为中医“胃痞”的诊断是一致的。
  在预处理后的病例数据中保留了症状、处方二维信息。在该部分中将挖掘症状与用药之间的关联规则。本程序使用Apriori算法,利用Apirori性质,首先从事务集(120个病例)中,得到药物集和合症状集,之后针对每一个症状,统计与之相关的药物出现频次,通过最小支持度与最小置信度得到强关联规则,挖掘出针对单个病症的用药规则。同理,组合症状,挖掘用药规则,从而得到推荐药方。研究李佃贵教授临证应用药对的关联规则,首先须确定研究对象,即临床常用药范围。研究选定120份病例中出现频次较高且与临床症状关联性较高的药物,即选取最小置信度为50%并且最小药物次数不小于5次时与临床症状相关联的药物作为研究对象,满足上述条件的药物包括砂仁、香附、厚朴、枳实、百合、乌药、当归、川芎、白芍、茯苓、白术、紫蔻、鸡内金、三七粉、白花蛇舌草、半枝莲、茵陈、板蓝根、苦参、黄芩、黄连、绞股蓝、藿香、炒莱菔子、紫苏、石膏等26种药物。统计以上26种药物在120份病例中两两匹配的次数,选择两两匹配次数在50次以上的药对,并从中确定每种药与之匹配次数最高的三对药对作为研究对象,同时分析药对的置信度。分析药对匹配次数、置信度两方面数据,总结李佃贵教授应用药对规律、临证治法及临床经验。
  3.3实验结果
  置信度为50%并且最小药物次数大于等于5次时症状与用药关联规则:
  [胃脘疼痛,嗳气,乏力,口干,口苦,纳差,失眠, 胃脘疼痛,嗳气,乏力,口干,口苦,纳差, 胃脘疼痛,嗳气,乏力,口干,口苦, 胃脘疼痛,嗳气,乏力,口干, 胃脘疼痛,嗳气,乏力, 胃脘疼痛,嗳气]
  此次运算,针对特定病症,药物的最小置信度为50%;出现次数出现大于等于5次的药物在考虑范围内。
  11:针对病症“呃逆”置信度大于50%的药物有:
  12:针对病症“烧心”置信度大于50%的药物有:
  砂仁(出现次数:19,置信度:59%) ;香附(出现次数:20,置信度:62%);
  厚朴(出现次数:23,置信度:71%);枳实(出现次数:25,置信度:78%);
  百合(出现次数:16,置信度:50%);乌药(出现次数:16,置信度:50%);
  当归(出现次数:17,置信度:53%); 川芎(出现次数:16,置信度:50%);
  白芍(出现次数:17,置信度:53%); 茯苓(出现次数:17,置信度:53%);
  白术(出现次数:16,置信度:50%); 紫蔻(出现次数:19,置信度:59%);
  鸡内金(出现次数:18,置信度:56%); 茵陈(出现次数:28,置信度:87%);
  黄芩(出现次数:26,置信度:81%);黄连(出现次数:30,置信度:93%);
  炒莱菔子(出现次数:21,置信度:65%);生石膏(出现次数:18,置信度:56%);
  结论
  对于挖掘得到的症状与用药之间的关联规则,从中医学角度进行分析,大部分得到了中医专家的认证,符合中医中“症状—辨证—处方”的规律。从以上统计数据中可以看出,在李教授临证常用药对中,理气药和清热药占了大多数。在统计的药对中,百合→乌药为百合汤的组成,黄芩→茵陈为茵陈黄芩汤的组成,黄连→茵陈为茵陈黄连汤的组成,紫苏→黄连可视为苏叶黄连汤的组成。当归、川芎、白芍三药的配对使用临床很常见,枳实→厚朴、黃连→黄芩、半枝莲→白花蛇舌草、枳实→莱菔子、枳实→香附的配伍,文献也有记载。以上这些药对的匹配次数和置信度都很高,已为广大医家所熟识和认可,虽然在数据挖掘领域认为是“无趣”的,但这些药对的应用无不体现着李佃贵教授扎实的理论功底和丰富的临床经验。
  通过这些关联规则的挖掘,可以挖掘宝贵的中医临床经验,其中包含了医生个人的诊断习惯。在挖掘的结果中,有的关联规则的置信度很高,但这不能说明所挖掘的关联规则是绝对的可信,因为受我们样本数据本身特点的限制,加上数据预处理阶段不能保证百分之百地正确,就可能导致挖掘结果的误差。但是高的置信度也从另一个方面反映出我们挖掘出的关联规则是客观存在的,还是可以挖掘出中医学隐性知识的。对于挖掘结果进行分析,发现均具有宝贵价值,可以体现出治疗疾病的药对和药组的特性具有重要的意义。
  参考文献:
  [1] “百名名中医治疗慢性萎缩性胃炎临床经验资料的计算机分析研究”,发表于《中国中医基础医学杂志》,2008,14(1),62-63.
  [2] “从数据挖掘角度看中医药治疗健忘与痴呆”,发表于《中日友好医院学报》2006,20(6),337-340.
  [3] “基于数据挖掘的龙胆泻肝汤类方关联分析”,发表于《辽宁中医杂志》,2009,36(6),877-879.
  [4] “中药功效数据集市的多维分析和数据挖掘研究”,发表于《中草药》,2010,4(12),2106-2108.
  (作者单位:石家庄市中医院)
其他文献
【摘 要】 中学数学在注重逻辑思维能力培养的同时,还应该注重观察力、直觉力、想象力的培养。直观与直感都是以真实的事物为对象,通过各种感觉器官直接获得的感觉或感知。培养直觉思维能力是社会发展的需要。  【关键词】 数学 直觉思维 培养  1. 数学直觉概念的界定  1.1直觉与直观、直感的区别  直观与直感都是以真实的事物为对象,通过各种感觉器官直接获得的感觉或感知。例如,等腰三角形的两个底角相等的
期刊
【摘 要】 随着近年来我国高校暴力事件、自杀事件的不断增多,大学生生命价值观教育问题显得越来越重要。本文采取了问卷调查的方式以高职院校学生为对象,了解高职生生命价值观念现状,并针对当代高职生生命价值观的诸多问题进行思考和建议。  【关键词】 高职 生命 价值观 现状  前言  生命价值是指一个人的生命所具有的自我价值和社会价值,是自我价值和社会价值的统一。它是指人们对生命存在形式的总的价值判断,指
期刊
【摘 要】 明确概念的定义和作用,理解好概念的内涵与外延,是人一生要学习的内容。在职业技术教育中,如何帮助学生建构课程的科学概念是教育的基本任务。人只要张口说话、提笔写字、动脑思考就要用到概念,甚至连做梦也离不开概念。一个人正确理解的概念越多,对当前世界掌握的就越多。  【关键词】 概念 科学概念 怎样理解一个概念 建构科学概念  在职业技术类院校讲授课程,无论课程的类型如何,或多或少、或浅或深地
期刊
【摘 要】 在经济全球化、医学教育国际化背景的影响下,护理专业学生英语水平的提高日益重要。根据目前护理专业英语教学现状分析,现有的教学理念、教学方法、评价体系等方面已不能适应护理专业英语教学的需要。因此,切实加强护理专业英语教学是十分必要的。本文就高职护理专业英语教学改革的有效途径谈几点思考。  【关键词】 护理专业 英语教学 教学改革 有效途径  引言  就目前护理专业英语教学现状分析,由于教学
期刊
【摘 要】 兴趣是成功的先导,是探究或从事某种活动的一种认识倾向,是学生学习的根本动力和内驱力,它是可以激发培养的。近年来,越来越多的孩子对数学的学习失去兴趣,笔者就如何激发小学生对数学学习的兴趣,做了以下尝试:  【关键词】 小学数学教学 学习兴趣 学生  1. 联系实际,引发学生的兴趣  众所周之,小学生的思维受成长所限,认识感知实际知识需要一个过程,培养其兴趣,尤其重要,特别是抽象的数学问题
期刊
【摘 要】 本文论述了电子商务竞赛的功能价值。分析了电子商务技能竞赛中选手及项目的特点,以及竞赛中中职参赛选手存在的技术问题,结合专业教学实践,提出专业教学实训改革的新思路。  1. 中职职业技能竞赛的特点  为了推动职业教育深化改革, 提高人才培养质量, 在国务院的领导下, 教育部和其他部委、 各地、 各职业院校认真贯彻落实国务院关于大力发展职业教育的决定精神, 积极举办了内容丰富、形式多样、 
期刊
我像所有的人一样,曾经是儿童。尽管我的童年是清苦的,我仍然享受到作为儿童特有的幸福和快乐。小时候,我们住的房子又矮又小,石灰粉的墙壁早已灰黄。当我独个儿睡在床上时,我会呆呆地看着那斑驳的墙壁,想象着小屋里没有的世界:那是一个和尚披着飘飘欲仙的袈裟向我走来,那宽大的袖子里藏着什么呢?那是一棵长果子的大树,许多小鸟正向它飞来,回到自己的家 这正像茅盾先生《天窗》中的主人公,努力地想象天窗中的一块蓝天,
期刊
【摘 要】 本文对经济法的起源及其基本功能之间的内在逻辑展开论述,首先从市场失灵的内在动因和政府失灵的客观需求两个方面解析了经济法的起源,紧接着,结合经济法的起源对经济法的本质内涵、基本内容与功能进行了剖析与总结,最后,揭示出了经济法的起源与其基本功能之间的内在逻辑关系。  【关键词】 经济法 起源 基本功能 内在逻辑  1. 经济法的起源  “经济法”这一概念早在18 世纪就已经在法国空想社会主
期刊
【摘 要】 分层次教学能够有效解决初中数学教学中如何面对基础各异的学生的难题。本文在系统分析初中数学实施分层次教学必要性的基础上对分层次教学的策略做了一定探讨。  【关键词】 分层教学 因材施教 评价考核  1. 问题的提出  所谓分层次教学就是从实际出发,将一个班的学生按基础知识、基本能力、学习风格、个性特长等分为幾个层次,老师给予具体的有效指导,使每个学生都能在原有基础上得到全面、自由、优化的
期刊
【摘 要】 随着社会的发展,学生的个性发展也越来越受到重视。因此,体育课根据自身特点,通过因材施教在学生的良好个性培养方面起着不可低估的作用。体育既是学校教育的重要内容,也是发展学生个性的重要手段,在体育教学过程中应创造条件,促进学生个性健康活泼地发展,造就一大批富有鲜明的个性特点,能适应社会发展需要的健康人才。发展学生的个性已成为体育教学追求的重要目标之一。  【关键词】 体育课 学生个性 作用
期刊