论文部分内容阅读
1目的1.1通过Weka (Waikato Environment for Knowledge Analysis)软件的应用,重点探索贝叶斯网络等机器学习方法在名老中医学术思想、经验传承研究应用前景,进一步探索促进中医学术经验传承和学术流派发展的有效方法;1.2应用跟师学习与机器学习相结合,群案分析与个案分析相结合,监督学习与无监督学习相结合,定性研究与定量研究相结合的研究方法,分析、总结和继承施今墨学术流派诊治糖尿病的学术思想与临床经验;1.3引入循证思路,形成适合中医学特点,借助集“规范化采集”“网络化存储”“标准化处理”“多元化挖掘”四位一体的中医医案信息化共享平台,探索由“经验”向“知识”再向“证据”转化的名老中医学术思想与临床经验继承研究多元化途径。2方法2.1数据采集以施今墨学术流派具有明确传承轨迹的4位医家,施今墨、祝谌予、吕仁和、赵进喜诊治的糖尿病医案为研究对象。参照“十五”国家科技攻关计划“名老中医学术思想、经验传承研究”要求的病例采集格式,采用统一设计、标准规范、项目齐全、重点突出的病例信息采集表观察、采集、转录一般资料、病史资料、刻下症、体格检查与四诊资料、理化检查资料、中医诊断、证候诊断和立法、处方用药、辅助疗法与医嘱及医师临证思辨经验、语录。2.2数据录入对符合规范的病例信息采集表数据用Microsoft office Excel14.0.6112.5000进行双人双录入,其后转化为CSV (Comma Separated Value)等统计分析要求的数据格式。2.3数据处理与质量控制对采集数据进行数据清理、数据集成、数据变换和数据归约。应用规范统一的病案采集表并经过统一培训控制采集质量,双人双录入,逐条核对控制录入质量,借助VBA(Visual Basic for Application)编译程序控制数据质量与数据结构转换质量。3.4统计分析与数据挖掘采用SPSS (Statistical Product and Service Solutions)13.0统计分析系统进行,对D性别,E年龄,G应诊医师,J诊次,K病案类型,N主诉,Q刻下症,S舌象,T脉象,U既往病史,X空腹血糖、餐后血糖,AB病因,AC西医诊断,AD中医诊断,AF中医证候,AH证素,AJ治法(归约),AK处方,AL处方药物,AM主方,AN剂量,AO药味,AP剂型等项目采用描述性分析,对数据频数、集中趋势、离散趋势进行统计分析。应用Weka3.6软件对Q刻下症、AE中医诊断(归约)、AG中医证候(归约)、AH证素、AJ治法(归约)、AL处方药物、AM主方等“病-证-症-法-方-药”核心属性数据进行分类、聚类、关联等分析。应用中医处方智能分析系统(Chinese Medicine Prescription Intelligence Analysis System, CPIAS)(北京中医药大学中医信息研究室研制中)网络版对4位医家典型医案的相对药量、药性、药味、归经、方剂功效、筛选功效、症状重排、证素、筛选证素、方剂证候进行个案分析。3结果3.1纳入情况依据纳入标准、排除标准进行遴选,研究纳入施今墨、祝谌予、吕仁和、赵进喜(以下简称4位医家)诊治糖尿病病例938例,其中初诊414例,复诊524例,回顾性病例487例,前瞻性病例451例。施今墨诊疗病例23例,其中初诊12例,复诊11例;祝谌予诊疗病例337例,其中初诊121例,复诊216例;吕仁和诊疗病例447例,其中初诊203例,复诊244例;赵进喜诊疗病例132例,初诊病例78例,复诊病例53例。共收集4位医家诊疗经验包括辨证要点、病因分析、病机变化、治法思路、遣方用药特色与经验等共计1904项,其中施今墨诊疗经验59项,祝谌予诊疗经验1015项,吕仁和诊疗经验503项,赵进喜诊疗经验327项。3.2描述性分析结果在纳入分析的938例医案中,患者男性475例,女性463例;患者年龄最大85岁,最小18岁,年龄中位数为55岁,平均年龄为55.56±12.290岁;初诊共计出现口渴多饮等48个症状;患者糖尿病病程最长的392个月,最短的3天,平均73.41±71.821月;共计出现2型糖尿病等60个西医诊断疾病及消渴病等59个中医诊断疾病及脾痒(期)、消渴期、消瘅期3个疾病分期,其中前3位的是:消渴病930例,占总数99.04%,消渴病肾病249例,占总数26.52%,消渴病·风眩215例,占总数22.90%;共计出现久病正虚等13个病因,其中前3位的是久病正虚121例,占总数29.23%,饮食不节78例,占总数18.84%,情志不舒62例,占总数18.84%。在纳入分析的938例医案中,共计出现疲乏等259个症状,其中前3位的是:疲乏332例,占总数35.39%,视瞻昏渺249例,占总数26.55%,口渴多饮154例,占总数16.42%;共计出现细脉等56个舌象、脉象;共计出现气阴两虚等138个中医证候,其中前3位的是:气阴两虚334例,占总数35.57%,肝肾亏虚264例,占总数28.12%,经脉不活195例,占总数20.77%;共计出现血瘀等49个中医证素,其中前3位的是:血瘀776例,占总数82.73%,肾730例,占总数77.83%,肝692例,占总数73.77%;共计出现活血等98个中医治法(归约),其中前3位的是:活血806例,占总数85.93%,益气620例,占总数66.10%,健脾595例,占总数63.43%;在纳入分析的938例医案中,共计出现降糖对药方等125个中医处方主方。其中前3位的是:降糖对药方257例,占总数27.40%,狗脊饮子121例,占总数12.90%,当归补血汤106例,占总数11.30%;共计出现丹参等365个中药药物,其中前3位的是:丹参626例,占总数66.74%,黄芪513例,占总数54.69%,地黄402例,占总数42.86%;医案处方汤剂921例,蜜丸2例,水丸14例,中成药1例,外洗3例;医案处方最大剂量60付,最小剂量1付,平均剂量为13.96±4.375付;医案处方最大药味数36味,最小药味4味,中位数15味,平均药味数为14.70±3.151味。3.3机器学习与数据挖掘结果施今墨医案以“阴虚”作为分类属性进行贝叶斯网络分析,分类准确率达95.65%,Kappa值0.7767,发现病-证-症-法-方-药之间的结构关系57条,如以脏养脏->尿多(0.917)等(括号中为条件概率值),其父项(节点)与子项(节点)之间互相关联并形成一定规律,如茯神->不寐->心->茯苓,体现了茯苓、茯神与心、神证素和不寐症状之间的内在联系;以“气阴两虚”作为分类属性进行支持向量机的SMO分析,分类准确率达86.86%,Kappa值0.7315,并得出证-症之间的权重关系,其中阈值=1.002,权重在0.45以上的症状有(括号中为权值):消瘦(1.0433)、疲乏(0.5515)、大便秘结(0.4878)、小便浑浊(0.4869);关联规则分析提示:山药、黄芪,党参、黄芪,五味子、黄芪,天花粉、山药、黄芪,麦冬、黄芪,绿豆衣、天花粉,山药、玄参、黄芪,山药、五味子、黄芪,天花粉、黄芪,玄参、黄芪,瓜蒌子、天花粉之间存在着明显的配伍运用规律。祝谌予医案以“调气活血方(黄芪)”作为分类属性进行贝叶斯网络分析,分类准确率达99.41%,Kappa值0.9773,发现病-证-症-法-方-药之间的结构关系68条,如健脾->肾(0.995)等,再如经脉不活->寄生->续断->夜尿频多,体现了寄生、续断与经脉不活证候和夜尿频多症状之间的内在联系;以“山药”作为分类属性进行基于支持向量机的SMO分析,分类准确率达89.91%,Kappa值0.5661,并得出药-症之间的权重关系,其中阈值=0.9998,权重在0.45以上的症状有(括号中为权值):消瘦(0.9771)、腰痛(0.9476)、遇劳加重(0.8744)、弦脉(0.8203)、口渴多饮(0.8146)、尿多(0.771)、大便溏(0.7271)、紫红舌(0.6176)、善太息(0.5521)、食欲不振(0.5504)、腻苔(0.4971)、头痛(0.4875)、烦热(0.4829)、滑脉(0.4643)、疲乏(0.4614);SimpleKMeans药物聚类分析得到类别1为调气活血方(黄芪)+桑寄生、鸡血藤,类别2为降糖对药方+桑寄生,类别3为降糖对药方+温清饮,类别4为降糖对药方+生脉散。关联规则分析提示:黄芩、黄连,黄芪、黄连、黄芩,北沙参、五味子、麦冬,玄参、麦冬、五味子,地黄、苍术、丹参,黄芪、玄参、葛根,黄芪、玄参、葛根,地黄、苍术、丹参,葛根、丹参,苍术、玄参之间存在着明显的配伍运用规律。吕仁和医案以“消渴病肾病”作为分类属性进行贝叶斯网络分析,分类准确率达70.6935%,Kappa值0.4122,发现病-证-症-法-方-药之间的结构关系98条,如消癥->鬼箭羽(0.901)等,再如茵陈->栀子->清热->火热->解毒->毒,体现了茵陈、栀子与火热、毒证素和清热、解毒治法之间的内在联系;如丹参->活血->血瘀->消癥->鬼箭羽->细脉,体现了丹参、鬼箭羽与活血、消癥治法以及血瘀证素和细脉症状之间的内在联系;以“散结”作为分类属性进行基于支持向量机的SMO分析,分类准确率达94.18%,Kappa值0.76,并得出证-症之间的权重关系,其中阈值=1.5764,权重在0.45以上的症状有(括号中为权值):荔枝核(2.618)、夏枯草(1.6079)、土鳖虫(0.9953)、桃仁(0.7243)、鬼箭羽(0.7023)、乌药(0.6656)、山药(0.6571)、太子参(0.5925)、瓜蒌(0.5773)、紫苏梗(0.5322)、红景天(0.4631);药物EM聚类分析,得到类别1为滋阴清热生津为主的玄参、知母、地黄、黄连、葛根,类别2为以赤芍疏肝益肾为主的牛膝、狗脊、枳实、白芍、枳壳、川断、杜仲、柴胡,类别3为以益气活血、理气和胃为主的丹参、丹皮、枳实、枳壳、川芎、太子参、佛手、香橼,类别4为以益气养血活血为主的丹参、丹皮、赤芍、甘草、当归、黄芪、川断,类别5为以补肾活血为主的丹参、丹皮、牛膝、狗脊、续断;关联规则分析提示:桃仁、红花,丹参、当归、黄芪,牡丹皮、狗脊、丹参、川牛膝,续断、川牛膝、狗脊,赤芍、枳壳、白芍,当归、黄芪,川牛膝、续断、狗脊,续断、狗脊,杜仲、狗脊,续断、川牛膝,枳壳、枳实,丹参、牡丹皮、狗脊、川牛膝,赤芍、白芍,白芍、赤芍,枳实、赤芍,赤芍、丹参、牡丹皮之间存在着明显的配伍运用规律。赵进喜医案以“消渴病肾病”作为分类属性进行贝叶斯网络分析,分类准确率达93.13%,Kappa值0.8489,发现病-证-症-法-方-药之间的结构关系81条,如消渴病肾病->解毒(0.83)等,又如气虚->气阴两虚->气滞->理气->北沙参,气虚->气阴两虚->气滞->理气->枳壳之间的2条直线条件关系共同构成一个网络关系,揭示气虚、气阴两虚、气滞与理气治法和北沙参、枳壳药物之间的内在联系;以“少阴阴虚体质”作为分类属性进行基于支持向量机的SMO分析,分类准确率达80.15%,Kappa值0.5109,并得出证-症之间的权重关系,其中阈值=1,权重在0.45以上的症状有(括号中为权值):皮肤瘙痒(2.0101)、急躁(1.6854)、咽喉不利(1.2308)、口干(1.1764)、遇劳加重(0.8922)、咽干(0.8128)、目眩(0.6759)、憋气(0.5439)、消瘦(0.5396)、视瞻昏渺(0.4876)、自汗(0.4857)、气短(0.4734)、腰膝无力(0.4694);药物SimpleKMeans聚类分析,得到类别1为以益气养血、利水渗湿为主的加味当归补血汤,类别2为以益气升陷、为主的加味升陷汤,类别3为以清热养阴、活血散结为主的降糖方,类别4为以益气养血、活血化瘀、泄浊解毒、为主的芪归升降散,类别5为以疏肝理气,养血活血为主加味四逆散;关联规则分析提示:僵蚕、姜黄、蝉蜕,当归、僵蚕、姜黄,蝉蜕、僵蚕,白芍、柴胡、赤芍,土茯苓、川芎、当归,黄芪、当归、川芎,川芎、当归,荔枝核、鬼箭羽,丹参、白芍、赤芍,赤芍、白芍,当归、黄芪、土茯苓,姜黄、当归,丹参、鬼箭羽、葛根,荔枝核、葛根,丹参、黄连、葛根,白芍、赤芍、柴胡,土茯苓、当归、川芎,当归、川芎、土茯苓,鬼箭羽、丹参、葛根,黄连、葛根,葛根、丹参,地黄、葛根,当归、黄芪,柴胡、白芍之间存在着明显的配伍运用规律。此外对施今墨、祝谌予、吕仁和、赵进喜典型医案4例共7诊次进行基于宏观量化技术的CPIAS个案分析,得到相对药量、综合药性、综合药味、综合归经、筛选功效、症状权重、筛选证素、方剂证候等信息。4结论研究采用跟师学习与机器学习相结合,群案分析与个案分析相结合,监督学习与无监督学习相结合,定性研究与定量研究相结合的方法对于施今墨学术流派诊治糖尿病学术思想和临床经验继承进行了有益探索,挖掘了学术流派名老中医思辨规律定量数据,证实施今墨学术流派学术思想系统,临床经验丰富,大量总结工作亟待开展;基于“以人为本”“点面结合”“常变兼顾”“量性双重”思路的数据挖掘方法在名老中医学术思想、临床经验总结方面展现出良好的效能;基于循证思路的名老中医学术思想、经验传承研究方法学有待进一步探索。