论文部分内容阅读
摘 要:根据证候,辨别证素,组成证名,是中医辨证的规律与过程。中医辨证是非线性的复杂巨系统,为解决辨证研究中诊断权值的确定这个关键问题,在频数统计基础上,实行“双层频权剪叉”算法,获得了准确的辨证参数,在非线性、多变量分析上探索出了一种新的运算方式。
关键词:辨证;证素;证候;数据挖掘;频权剪叉算法
中图分类号:R2-03文献标识码:A文章编号:1673-2197(2007)09-023-03
中医辨证是非线性的复杂巨系统,对辨证的研究应该建立在数据挖掘的理念上,以证素为信息分析的核心,运用复杂系统分析方法,探索从证候确认证素的有效方法。
1 中医辨证规律与体系
在中医学中,“证”相对于“病”来说,是对疾病中机体整体反应状态的阶段性病理本质概括。疾病中患者的症状、体征等各种病理信息,中医称为证候;中医辨证的目的,是为了明确病位与病性等辨证要素,简称证素;各证素的相互组合,可概括成完整的证名诊断。“辨证”就是根据中医学理论,通过对证候(症状等)进行分析,而确定其病理本质——证素,并作出证名诊断的思维认识过程[1]。
“根据证候,辨别证素,组成证名”,既是辨证的原则、规律,也是辨证思维过程中的三个台阶、三个步骤。证候—证素—证名之间存在着极其复杂的网络关系,构成以证素为核心的辨证体系。中医不是依赖个别“金指标”对病情作出判断,不是从局部处理不确定性,而是强调从整体进行分析,即从各方面综合诊察疾病中机体现阶段的整体反应状态。因此,中医辨证是非线性的复杂巨系统。
临床上常见的“证候”,如发热、头痛、心慌、盗汗、头晕、食欲不振、小便短黄、面色晦暗、舌胖嫩、苔腻、脉弦等,约有1000个。通常确定的“证素”,如心、肺、脾、肝、肾、胃、胞宫、表、经络等病位,寒、火热、湿、痰、气虚、气滞、血瘀、阴虚等病性,约为50项。由50项证素组合成的“证名”,如脾胃气虚证、肾阴虚证、肝胆湿热证、肝郁脾虚证等,多达数千个。对证候、证素、证名三个层次的辨别判断,共同构成中医辨证体系。
2 双层频权剪叉算法原理
中医辨证研究应该建立在数据挖掘的理念上,相应数理模型和算法的建立,是实现从定性描述到定量分析这一途径的必要方法。由于中医辨证是非线性复杂系统,现有的数据处理方法,尚不能完全反映中医辨证的规律,尚难解决在证的多变量信息分析中诸如有效因素组合爆炸之类的问题。因此,找到一种适合要求的数据挖掘方法,对于中医辨证的研究至关重要。
中医临床辨证的实践提示,从证候辨别证素具有多维复杂性,每个症状对各证素判断的贡献度,并不是简单的以出现频次的多少为依据,有些证候临床出现的频次虽然很高,但其对证素的判断能力并不强,与之相反,某些证候临床发生的频次虽然不高,但其对证素的诊断具有很强的特征性。为了避免一些变量的频次范围过大,另一些变量的频次范围过小,而形成的局部优化、判别偏移,必须将频次转化成权值,即根据证候的不同属性,拟定各证候的标准化权值、各证素的标准化权值。为使每个证候纳入判断的机遇相等、每项证素纳入判断的机遇相等,因而应当是高频次变量的权值轻、低频次变量的权值重的原则,这就是“频权剪叉”(如图1所示)。据“频权剪叉”原理,对证素所见证候的权值进行分配,将各症状对各证素、证型的贡献度进行分配,形成证候标准化权值、证素标准化权值,故为“双层”。
权值拟定的方法是:(1)从“中医辨证数据库”[2]中将证候、证素出现的频次(证候总频次、证素总频次,各证候发生相关证素的频次、各证素发生相关证候的频次)进行累计;(2)按高频变量权轻,低频变量权重的原理,根据各证候的总频次计算出各自的权重、根据各证素的总频次合理分配出各自的权重;(3)将某证候在某证素中出现的频次乘以该证候的权值、乘以该证素的权值,即为该证候对相关证素的判别系数。
3 验证举例
我们在所建“中医辨证数据库”的基础上,采用“双层频权剪叉”算法,能够提取证素、证型的特征证候,获得中医辨证的准确参数。
3.1 证素特征症的提取
从“中医辨证数据库”中提取指定证素的证候频次。证候频次×证候权值×证素权值=证素的证候系数。如证素“寒”的主要证候系数及排序见表1。
采用双层频权剪叉算法,提取出病性证素“寒”的特征证候,与《现代中医临床诊断学》[3]所说“以新起恶寒,无汗,头身、肢体、脘腹或腰部等处冷痛,得温痛减,形体蜷卧,分泌物或排泄物清稀,舌苔白,脉紧、弦迟或伏等为主要表现者,其病性可辨属于(实)寒。”的论述非常相似。
3.2 常见证型的特征症提取
从“中医辨证数据库”中提取指定常见证型所含证素的证候频次。证候频次×证候权值×证素权值=指定证型主要证候系数。如心血瘀阻证主要证候系数及排序,见表2。
采用双层频权剪叉算法,提取出心血瘀阻证的证候特征,已将心血瘀阻证“以胸闷心悸,心痛如刺、痛引肩背内臂,唇舌紫暗,脉细涩或结代等”[3]的证候概括其中。
3.3 证候辨证权值提取
从“中医辨证数据库”中提取指定证候的频次。证候频次×证候权值×证素权值=指定证候的辨证权值。如“盗汗”辨证素的权值及排序,见表3。
3.4 辨证检验举例
临床辨证时,将所出现的证候,按照“双层频权剪叉”算法原理,确定各症映射相关证素的系数;再按证素进行系数累加,系数达到及超过阈值以上的证素诊断成立。如1334号病例的辨证计算,见表4。
据上述计算,取系数80以上的证素——阳虚、阳浮,从而诊断为虚阳浮越证。虚阳浮越证在临床上颇难辨别,而本例辨证非常准确。
4 结论
只有原始资料的丰富完整,才能从中挖掘出有意义的信息。从大量的数据中进行辨证特征的规则提取,能够抽提出比较全面的内在规律。“中医辨证数据库”中的资料(症状、证素等),入库时首先经过规范化处理,保证了原始资料的准确,从而为辨证参数的获取奠定了基础。
在中医辨证体系的框架下,以临床信息为对象,采用双层频权剪叉算法,从杂乱无章的数据中,找出了确认证素、证型的科学方法。合理度量了变量间的相关性,能明确证素、常见证的特征证候,能明确各症状的诊断贡献度,建立起证候与证素、证型间的非线性映射函数,对认识证候与证素、证型间复杂的非线性关系具有重要意义。“双层频权剪叉算法”克服了神经网络、贝叶斯网络等算法的某些不足,为中医辨证研究找到了一种简便、准确的运算方式。
参考文献:
[1] 海霞.朱文锋教授谈证素辨证新体系[N].中国中医药报,2004-04-06.
[2] 朱文锋.证候辨证量表制定的科学性要求[J].中国中医药信息杂志,2005,12(8):11-13.
[3] 朱文锋,何清湖.现代中医临床诊断学[M].北京:人民卫生出版社,2003.
New Information Disposal for TCM Syndrome Differentiatin
——Introduction on Algorithm of Double Levels of Frequency and Weight
Zhu Wenfeng,Huang Biqun,He Junfeng
(Hunan college of TCM,Changsha,410007,China)
Abstract: According to syndroms and signs, differentiating syndrome factor and forming syndrome type, which is the rule and process for forming the TCM syndrome differentiation. TCM syndrome differentiation is a nolinear complex giant system, in order to solve the key problem for determination on diagnose weight value of syndrome factor differentiation, based on the analysis of frequency statistics, a new algorithm of double levels of frequency and weight was applied, and the accurate syndrome differentiation parameters acquired. Therefore, based on the nonlinear and multivariate analysis, a new algorithm of calculating diagnostics for syndrome factor differentiation was established.
Key word: Syndrome differentiation; Syndrome factor; Symptoms and signs; Data research; Algorithm of double levels of frequency and weight
关键词:辨证;证素;证候;数据挖掘;频权剪叉算法
中图分类号:R2-03文献标识码:A文章编号:1673-2197(2007)09-023-03
中医辨证是非线性的复杂巨系统,对辨证的研究应该建立在数据挖掘的理念上,以证素为信息分析的核心,运用复杂系统分析方法,探索从证候确认证素的有效方法。
1 中医辨证规律与体系
在中医学中,“证”相对于“病”来说,是对疾病中机体整体反应状态的阶段性病理本质概括。疾病中患者的症状、体征等各种病理信息,中医称为证候;中医辨证的目的,是为了明确病位与病性等辨证要素,简称证素;各证素的相互组合,可概括成完整的证名诊断。“辨证”就是根据中医学理论,通过对证候(症状等)进行分析,而确定其病理本质——证素,并作出证名诊断的思维认识过程[1]。
“根据证候,辨别证素,组成证名”,既是辨证的原则、规律,也是辨证思维过程中的三个台阶、三个步骤。证候—证素—证名之间存在着极其复杂的网络关系,构成以证素为核心的辨证体系。中医不是依赖个别“金指标”对病情作出判断,不是从局部处理不确定性,而是强调从整体进行分析,即从各方面综合诊察疾病中机体现阶段的整体反应状态。因此,中医辨证是非线性的复杂巨系统。
临床上常见的“证候”,如发热、头痛、心慌、盗汗、头晕、食欲不振、小便短黄、面色晦暗、舌胖嫩、苔腻、脉弦等,约有1000个。通常确定的“证素”,如心、肺、脾、肝、肾、胃、胞宫、表、经络等病位,寒、火热、湿、痰、气虚、气滞、血瘀、阴虚等病性,约为50项。由50项证素组合成的“证名”,如脾胃气虚证、肾阴虚证、肝胆湿热证、肝郁脾虚证等,多达数千个。对证候、证素、证名三个层次的辨别判断,共同构成中医辨证体系。
2 双层频权剪叉算法原理
中医辨证研究应该建立在数据挖掘的理念上,相应数理模型和算法的建立,是实现从定性描述到定量分析这一途径的必要方法。由于中医辨证是非线性复杂系统,现有的数据处理方法,尚不能完全反映中医辨证的规律,尚难解决在证的多变量信息分析中诸如有效因素组合爆炸之类的问题。因此,找到一种适合要求的数据挖掘方法,对于中医辨证的研究至关重要。
中医临床辨证的实践提示,从证候辨别证素具有多维复杂性,每个症状对各证素判断的贡献度,并不是简单的以出现频次的多少为依据,有些证候临床出现的频次虽然很高,但其对证素的判断能力并不强,与之相反,某些证候临床发生的频次虽然不高,但其对证素的诊断具有很强的特征性。为了避免一些变量的频次范围过大,另一些变量的频次范围过小,而形成的局部优化、判别偏移,必须将频次转化成权值,即根据证候的不同属性,拟定各证候的标准化权值、各证素的标准化权值。为使每个证候纳入判断的机遇相等、每项证素纳入判断的机遇相等,因而应当是高频次变量的权值轻、低频次变量的权值重的原则,这就是“频权剪叉”(如图1所示)。据“频权剪叉”原理,对证素所见证候的权值进行分配,将各症状对各证素、证型的贡献度进行分配,形成证候标准化权值、证素标准化权值,故为“双层”。
权值拟定的方法是:(1)从“中医辨证数据库”[2]中将证候、证素出现的频次(证候总频次、证素总频次,各证候发生相关证素的频次、各证素发生相关证候的频次)进行累计;(2)按高频变量权轻,低频变量权重的原理,根据各证候的总频次计算出各自的权重、根据各证素的总频次合理分配出各自的权重;(3)将某证候在某证素中出现的频次乘以该证候的权值、乘以该证素的权值,即为该证候对相关证素的判别系数。
3 验证举例
我们在所建“中医辨证数据库”的基础上,采用“双层频权剪叉”算法,能够提取证素、证型的特征证候,获得中医辨证的准确参数。
3.1 证素特征症的提取
从“中医辨证数据库”中提取指定证素的证候频次。证候频次×证候权值×证素权值=证素的证候系数。如证素“寒”的主要证候系数及排序见表1。
采用双层频权剪叉算法,提取出病性证素“寒”的特征证候,与《现代中医临床诊断学》[3]所说“以新起恶寒,无汗,头身、肢体、脘腹或腰部等处冷痛,得温痛减,形体蜷卧,分泌物或排泄物清稀,舌苔白,脉紧、弦迟或伏等为主要表现者,其病性可辨属于(实)寒。”的论述非常相似。
3.2 常见证型的特征症提取
从“中医辨证数据库”中提取指定常见证型所含证素的证候频次。证候频次×证候权值×证素权值=指定证型主要证候系数。如心血瘀阻证主要证候系数及排序,见表2。
采用双层频权剪叉算法,提取出心血瘀阻证的证候特征,已将心血瘀阻证“以胸闷心悸,心痛如刺、痛引肩背内臂,唇舌紫暗,脉细涩或结代等”[3]的证候概括其中。
3.3 证候辨证权值提取
从“中医辨证数据库”中提取指定证候的频次。证候频次×证候权值×证素权值=指定证候的辨证权值。如“盗汗”辨证素的权值及排序,见表3。
3.4 辨证检验举例
临床辨证时,将所出现的证候,按照“双层频权剪叉”算法原理,确定各症映射相关证素的系数;再按证素进行系数累加,系数达到及超过阈值以上的证素诊断成立。如1334号病例的辨证计算,见表4。
据上述计算,取系数80以上的证素——阳虚、阳浮,从而诊断为虚阳浮越证。虚阳浮越证在临床上颇难辨别,而本例辨证非常准确。
4 结论
只有原始资料的丰富完整,才能从中挖掘出有意义的信息。从大量的数据中进行辨证特征的规则提取,能够抽提出比较全面的内在规律。“中医辨证数据库”中的资料(症状、证素等),入库时首先经过规范化处理,保证了原始资料的准确,从而为辨证参数的获取奠定了基础。
在中医辨证体系的框架下,以临床信息为对象,采用双层频权剪叉算法,从杂乱无章的数据中,找出了确认证素、证型的科学方法。合理度量了变量间的相关性,能明确证素、常见证的特征证候,能明确各症状的诊断贡献度,建立起证候与证素、证型间的非线性映射函数,对认识证候与证素、证型间复杂的非线性关系具有重要意义。“双层频权剪叉算法”克服了神经网络、贝叶斯网络等算法的某些不足,为中医辨证研究找到了一种简便、准确的运算方式。
参考文献:
[1] 海霞.朱文锋教授谈证素辨证新体系[N].中国中医药报,2004-04-06.
[2] 朱文锋.证候辨证量表制定的科学性要求[J].中国中医药信息杂志,2005,12(8):11-13.
[3] 朱文锋,何清湖.现代中医临床诊断学[M].北京:人民卫生出版社,2003.
New Information Disposal for TCM Syndrome Differentiatin
——Introduction on Algorithm of Double Levels of Frequency and Weight
Zhu Wenfeng,Huang Biqun,He Junfeng
(Hunan college of TCM,Changsha,410007,China)
Abstract: According to syndroms and signs, differentiating syndrome factor and forming syndrome type, which is the rule and process for forming the TCM syndrome differentiation. TCM syndrome differentiation is a nolinear complex giant system, in order to solve the key problem for determination on diagnose weight value of syndrome factor differentiation, based on the analysis of frequency statistics, a new algorithm of double levels of frequency and weight was applied, and the accurate syndrome differentiation parameters acquired. Therefore, based on the nonlinear and multivariate analysis, a new algorithm of calculating diagnostics for syndrome factor differentiation was established.
Key word: Syndrome differentiation; Syndrome factor; Symptoms and signs; Data research; Algorithm of double levels of frequency and weight