论文部分内容阅读
摘要 目的:分析《中国方剂数据库》收录治疗便秘方剂组方用药配伍规律,为临床治疗便秘提供研究依据。方法:选取并筛选《中国方剂数据库》收录治疗便秘方剂,采用频次分析、因子分析、系统聚类、关联规则分析等数据挖掘方法对筛选方剂组方用药进行分析。结果:共筛选287首治疗便秘的方剂,涉及中药211味,出现频数最高的单味药为甘草(109次),其次为大黄(103次);因子分析可提取出25个主成分;聚类数目为5类时较好,常用药物有大黄、黄芩、当归、芍药、陈皮、木香、地黄、人参等,演化得到核心组合10个;关联分析显示:大黄配伍黄芩、栀子;大黄配伍芒硝;甘草配伍栀子、黄芩;大黄配伍黄连为常用药对。结论:《中国方剂数据库》收录治疗便秘方剂药类以补虚、解表、清热、理气、泻下以及化痰平喘为主。而大黄→槟榔;当归→地黄;甘草→陈皮;羌活→防风;芍药→当归值得进一步讨论。
关键词 数据挖掘;便秘;配伍规律;系统聚类分析;关联规则分析
Abstract Objective:To analyze the compatibility rule of Chinese Prescription Database in the treatment of constipation,and to provide basis for clinical treatment of constipation.Methods:Based on the screening of formula in the treatment of constipation in the Chinese Prescription Database,we collected and analyzed the prescription by frequency analysis,factor analysis,system clustering,association rule analysis and other data mining methods.Results:A total of 287 prescriptions for constipation were screened,involving 211 Chinese herbs,and the most frequent one was Radix Glycyrrhizae(109 times),followed by Radix et Rhizoma Rhei(103 times).Factor analysis can extract 25 principal components.The cluster number of 5 kinds was good,and commonly used drugs were Radix et Rhizoma Rhei,Radix Scutellariae,Radix Angelicae Sinensis,Paeonia Lactiflora,Pericarpium Citri Reticulatae,Radix Aucklandiae,Radix Rehmanniae Recens,Radix Ginseng,etc.,and 10 core combinations were obtained.The correlation analysis showed that Radix et Rhizoma Rhei combined with Radix Scutellariae and Fructus Gardeniae; Radix et Rhizoma Rhei with Natrii Sulfas; Radix Glycyrrhizae with Fructus Gardeniae and Radix Scutellariae; Radix et Rhizoma Rhei with Rhizoma Coptidis were known drug pair.Conclusion:The drugs of formula for constipation in Chinese Prescription Database were mainly tonifying deficiency,relieving superficies,clearing away heat,regulating qi,purging purgation and eliminating phlegm and relieving wheezing.And Radix et Rhizoma Rhei→ Semen Arecae; Radix Angelicae Sinensis→ Radix Rehmanniae Recens; Radix Glycyrrhizae→ Pericarpium Citri Reticulatae; Rhizoma et Radix Notopterygii→ Radix Saposhnikoviae; Paeonia Lactiflora→Radix Angelicae Sinensis are worthy of further discussion,which will provide some reference for the research and development of new drugs of TCM for constipation.
Key Words Data mining; Constipation; Formulating rules; Hierarchical clustering; Association rules
中圖分类号:R243;R574文献标识码:Adoi:10.3969/j.issn.1673-7202.2019.08.054
便秘是指大肠传导功能失常,导致大便秘结,排便周期延长;或周期不长,但粪质干结,排便困难;或粪质不硬,虽有便意,但排出不畅的病证[1]。《黄帝内经》首载便秘之症,称其为“后不利”“大便难”。汉·张仲景《伤寒杂病论》中将便秘称为“脾约”。刘完素首倡实秘、虚秘之别,《素问病机气宜保命集·泻痢论》载:“凡脏腑之秘,不可一例治疗,有虚秘,有实秘,胃实而秘者,能饮食小便赤……胃虚而秘者,不能饮食,小便清利”。而便秘一名首见于清代沈金鏊的著作《杂病源流犀烛》中,并沿用至今。络脉从经脉分出后,逐级细分为别络至缠络、系络直至其末端孙络。随着络脉分支愈加细窄迁曲,络中气血的运行渐趋缓慢,一旦邪客络脉,络中气血的输布环流将受到影响,易致络脉瘀滞状态。气化功能失常,络气郁滞,或络气虚乏推运无力而滞,气化不利则津凝为痰,气失流畅则血行涩滞,痰瘀阻滞,络脉由滞到瘀,气血瘀塞不通。痰瘀阻络进一步影响气的升降出入运动而加重气滞。大肠传化功能的正常运行以及大便的通畅调合依赖于气机运行的调畅。例如肺主一身之气,与大肠相表里,若肺气失宜,壅滞不降,大肠传导阻滞则发为便秘。中药方剂是中医治疗的主要手段,基于博大而深厚的传统理论,其组成配伍规律庞杂多变。目前,基于数据挖掘技术对中医药方剂的研究主要集中于药证结合、中药组合、方剂配伍以及核心方药的发现方面。 基于络病理论,我们以国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的《中国方剂数据库》为检索数据库,应用频数分析、因子分析[2]、系统算法聚类分析[3]以及Apriori算法关联规则分析[4]等数据挖掘技术对治疗便秘方剂进行中药组方用药配伍规律分析,筛选所有便秘方剂中涉及的高频中药并从其药性、四气五味、归经配伍特点等方面加以探讨和研究,以期为治疗便秘方剂的理论知识及临床治疗便秘的组方用药提供思路,进而提高临床治疗效果。
1 资料与方法
1.1 数据来源
选取国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的《中国方剂数据库》中的方剂专题服务数据,包括方剂名称、药物组成、功效、主治。
1.2 数据筛选
以《中国方剂数据库》中的方剂专题服务数据为检索数据库,以方剂的主治、功效为依据,主治中明确载有脾约、闭、阴结、阳结、虚秘、气秘、风秘、热密、寒秘、大便不利、大便不通等字样者,或证候表现具有便秘症状者均在收录之列。对于方剂主治过于庞杂且组方用药对便秘缺乏针对性的条目,原则上不予以收录。
1.3 中药名称规范
参照《中药别名速查大辞典》[5]对中药别名及俗称予以规范;参照全国高等中医药院校“十二五”规划教材《中药学》[6]《中药大辞典》[7]内容予以规范,并对其中药功效进行归类。具体包括以下几个方面:1)中药别名和俗称:如朴硝归为芒硝,锦纹归为大黄等;2)中药合写或出现方剂名:如三白汤、三黄汤、栀子豉汤、六一散等将其补全;3)中药炮制或产地名称:如茅苍术、北苍术归为苍术,汉防己归为防己,南木香归为木香,川柴胡归为柴胡等;4)药名书写不规范或方剂组成相同:如将诃子归为诃梨勒等。中药名称规范化处理见附表1。
1.4 数据录入
将所纳入方剂按照表1格式进行录入,如果该方剂内含有此味中药则记录为“1”,反之,没有此味中药则为“0”。进行关联规则分析时,须将表1的数据格式进行转换,即将“1”“0”分别用“T”“F”替代并保存。
1.5 数据分析
应用频数及高频药物频率进行数据挖掘分析便秘方剂所有组成中药的构成情况,出现频数按照从高到低的顺序排序;应用因子分析挖掘高频药物的特征值、贡献率和综合得分;采用聚类分析中的系统聚类算法挖掘治疗便秘方剂的常用中药;采用关联规则分析中的Apriori算法挖掘高频中药药对之间的配伍关系。
2 结果
2.1 药物使用频次、频率分析
按照上述标准筛选后,得到明确可用于治疗便秘的方剂共287首,其中涉及中药211味,药物使用总频数达2 535次。通过频数頻率统计,单味药中使用频率最高的是甘草,共使用109次,使用频率为4.30%;大黄次之,共使用103次,使用频率为4.06%。使用频率排列前10位的中药依次为:甘草、大黄、黄芩、当归、芍药、陈皮、木香、地黄、桂枝、枳实。以单味药使用频数≥平均频数(使用频数≥12次)的69味中药为本次数据挖掘的高频药物。见表2。
2.2 高频药物性味、归经分析
按照《中药学》与《中药大辞典》统计高频药物四气、五味及归经的频数频率。见表4、表5、表6。其中,温性药物使用频率最高,达26.64%;寒性药物次之,达20.87%。五味属性中,辛味、苦味、甘味药物使用频数最高,均大于500次,其使用频率依次为33.38%,31.79%,21.58%,累计频率超过80%。归经属性中排列前5位的为脾经、肺经、胃经、肝经、心经。
2.3 高频药类使用频数、频率分析
将高频药物按照《中药学》与《中药大辞典》的药物分类标准进行分类,共得到药物类别16项,总频数为1 958次。见表3。由表3可见,补虚药使用频数最高,达331次,占总使用频数的17.50%;解表药次之,使用频数达305次,占总使用频数的16.13%;清热药使用频数达295次,占总使用频数的15.60%,位居第3位。使用频率排列前6的药类依次为:补虚药、解表药、清热药、理气药、化痰止咳平喘药、泻下药,在高频药物的累计频率中高达79.00%,可见历代治疗便秘的方剂涉及的药物种类、数量均较广泛,具体用药则较为集中。
2.4 因子分析结果
运用SPSS 19.0统计软件对高频药物进行因子分析,首先进行KMO和Bartlett的检验。见表7。KMO统计量为0.715(>0.5),Bartlett球形检验P=0.000(<≈0.05),说明药物间相关程度较好,适合做因子分析。前25个公因子累计方差贡献率达71.141%,说明可以用该25个公因子进行代替。见表8。运用最大方差法(即具有Kaiser标准化的正交旋转法)进行旋转,旋转在25次迭代后收敛,得到相对较好效果,提取出各公因子中载荷量>0.4者,若提出的变量在多个公因子中同时出现,说明其不能作为公因子代表,宜排除,得出结果:黄连(0.694)、栀子(0.685)、黄柏(0.679)、天花粉(0.664)、连翘(0.565)、玄参(0.514)在第一因子P1上有较高的载荷;白僵蚕(0.824)、天麻(0.784)、麝香(0.574)在第二因子P2上有较高的载荷;荆芥(0.729)、苍术(0.643)、葛根(0.632)在第三因子P3上有较高的载荷,以此类推,详见附表3。由旋转成分矩阵可写出每个成分的因子表达式,BX1=0.334×F1+0.111×F2+0.238×F3-0.173×F4-0.076×F5+……+0.180×F21+0.029×F22+0.182×F23+0.029×F24-0.211×F25。以此类推,可以得到其余BX2~BX69的表达式。依据个体因子F1中每个指标所对应的系数,得到个体因子F1的表达式,F1=-0.058×BX1+0.072×BF2+0.105×BX3+0.056×BX4-0.073×BX5+……+0.214×BX64-0.057×BX65-0.016×BX66-0.001×BX67-0.051×BX68+0.073×BX69。以此类推,可以得到其余F2~F25的表达式。碎石图见图1,旋转载荷见图2。 2.5 系统聚类分析结果
运用SPSS 19.0统计软件对高频药物进行系统聚类分析,聚类方法为Ward法,变量间距离定义使用平方Euclidean距离,聚类结果见图3。将结果聚为5大类较为合理,分别是第1类:大黄、甘草;第2类:1组:当归、地黄、芍药;2组:人参、白术、茯苓;3组:羌活、防风、川芎、桂枝;第3类:1组:黄连、黄柏;2组:栀子,桔梗,柴胡;3组:黄芩;第4类:1组:陈皮、木香;2组:香附、沉香、青皮、枳实、槟榔、厚朴;3组:枳壳、半夏;第五类:1组:芒硝、麦冬;2组:其他。演化得到10个核心组合结果见表9。
2.6 关联规则分析结果
运用SPSS 14.2统计软件进行高频药物的关联规则分析,设置参数:最低条件支持度=10%,最小规则置信度=55%,最终得到药物组合共32组,并据此分析结果进一步绘制出关联网络图。见表10和图4。分析可知,在2味药的关联规则中,甘草→黄芩和大黄→黄芩的支持度均为23.34%,并列第1位,其中甘草→黄芩的置信度更高,为58.21%,大黄→黄芩的置信度相对稍低,为56.72%;甘草→芍药的支持度为18.47%,置信度为67.92%,排列第3位。在3味药的关联规则中,大黄→黄芩、甘草的支持度最高,达18.47%,其置信度为67.92%;栀子→黄芩、大黄的支持度次之,达13.24%,其置信度为65.79%。
3 讨论
《兰室秘藏·大便结燥门》载:“若饥饱失节,劳役过度,损伤胃气,及食辛热味厚之物,而助火邪,伏于血中,耗散真阴,津液亏少,故大便结燥”;《扁鹊心书·便秘》载:“老人气虚,及妇人产后血少,致津液不行,不得通流,故大便常结”。《名医杂著》载:“证属形气病,形气俱不足,脾胃虚弱,津血枯涸而大便难尔”。由此可见阴阳气血不足均是导致便秘的内在基础,感受外邪是便秘发生的外在条件,热结、气滞、寒凝、津液耗伤为其病因根本,病位首在大肠,并同时与肺、脾、胃、肝、肾等脏腑关系密切。本研究依据国家人口与健康科学数据共享平台提供的方剂专题服务数据,筛选出与便秘相关的287首方剂,采用频数分析、因子分析、系统聚类、关联规则分析等数据挖掘方法,运用SPSS 19.0统计软件与SPSS 14.2统计软件等数据挖掘软件总结出治疗便秘的方剂用药及配伍规律,以期为便秘的临床治疗提供思路。
3.1 中药频数分析
通过对治疗便秘287首方剂所涉及到的69味高频药物用药分析可见,方剂中所涉及到的药物分类主要以补虚药、泻下药、理气药、解表药化痰平喘药以及活血化瘀药等为主。单味药使用频数≥50的药物有甘草、大黄、黄芩、当归、芍药以及陈皮。上述药物分类以及单味药的使用基本能够体现历代医家对便秘相关用药规律的认识。饮食不节、劳役过度、脾胃气虚等导致大肠通降失调,造成传导不利是便秘的基本病机。在便秘的发展过程中,热盛津伤占有主要影响地位[8]。此外,胃肠虚寒和肺脏功能失调亦是导致便秘的原因之一。因此,便秘治疗时以润肠清热为基本原则,又可根据病性的虚实,分别予以泻热、温散、通导、益气温阳或是滋阴养血之法。通过对287首治疗便秘方剂用药规律的研究显示,其结果恰如《景岳全书·秘结》曰:“阳结证,必因邪火有余,以致津液干燥。大肠热盛,燥屎内结。泻下热结,热去结散便通”。用药多以补阴药、泻下药为主。又如《伤寒名案选新注》载李士材医案:“治吴君明,伤寒六日,谵语狂笑,头痛有汗,大便不通,小便自利。方今仲冬,宜与桂枝汤……明日大便自通”巧用解表药治疗便秘[9]。清·陈士铎《石室秘录·大便闭结》云:“大便闭结者,人以为大肠燥甚,谁知是肺气燥乎?肺燥则清肃之气不能下行于大肠”[10]。明确指出便秘与肺有关,用药多以化痰平喘药与理气药等为主,契合便秘的治疗理念。就使用频数较高的药类分析来看,补虚药使用频次最高,其中以补气、补血药为主,代表药为当归、芍药、人参、白术、甘草等。解表药紧随其次,以桂枝、羌活和柴胡等药物为主。泻下药以大黄和芒硝等攻下药为主。清热药、理气药、化痰止咳平喘药、利水渗湿药以及活血化瘀药的使用频率也较高,具有一定的研究意义。因此便秘治疗总以扶正祛邪,恢复大肠传导功能为主。在便秘治疗中,补虚药与解表药占有重要地位,常配伍清热药,辅以理气、化痰、泻下药使用。
3.2 因子分析
因子分析的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量,来解释一组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子(每个因子被认为可解释多个观测变量间共有的方差,因此准确来说,他们应该称作公共因子)[11]。利用因子分析的意义在于比较分析治疗便秘方剂中的药物组方规律,通过因子载荷系数筛选出在治疗便秘中发挥功效的主要中药类别及单味中药。本研究显示,KMO统计量=0.715(满足>0.5的检测标准),由于提取主成分过多导致前25个主成分(F1~F25)对应的特征根介于1.273与3.760之间,彼此区别不是很大,不能很好的解释原始变量,概其原由是治疗便秘方剂过于庞杂所致。参照附表3,对25个主成分初步提取,例如黄连(0.694)、栀子(0.685)、黄柏(0.679)、天花粉(0.664)、连翘(0.565)、玄参(0.514)在F1上有较高的载荷;白僵蚕(0.824)、天麻(0.784)、麝香(0.574)在F2上有较高的载荷;荆芥(0.729)、苍术(0.643)、葛根(0.632)在F3上有较高的载荷;陈皮(0.758)、青皮(0.718)在F5上有較高载荷。从药类使用上分析,基本契合治疗便秘的常用药类,即以解表药、祛风湿药、补虚药、理气药、活血化瘀药、清热药、平肝熄风药、化痰止咳平喘药以及温里药等为主。因此,作为一种数学计算方法,因子分析在治疗便秘方剂的客观的定量评价方面具有优势,从另一个侧面为中医药治疗便秘提供了一个新的尝试性研究方法,为便秘方剂的临床应用提供了参考性指标。 3.3 系统聚类分析
系统聚类是实际工作中使用的最多的一种聚类方法,它具有十分明显的优点:可以对样品聚类,也可以对变量聚类。通过将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或性质接近(针对变量聚类)的两类合并为一类;再从这n-1类中找到最接近的2个类合并,以此类推,直到所有的样品或变量被合为一类。整个过程可以绘成聚类图,按图和具体问题来决定分类[12]。本研究运用系统聚类分析法,在通过对治疗便秘方剂数据的多次聚类后,结合治疗便秘方剂的药物组成分析,系统聚类模型显示,治疗便秘方剂比较好的聚类数目为5类。分析可见,第1类方剂主要由大黄、甘草等药物组成,聚一类以泻下药与补虚药相配伍,主要针对热结下焦与脾胃气虚两类病理因素;第2类方剂组成有当归、地黄、芍药均为补血药,针对阴血虚,润泽荣养不足所致便秘;人参、白术、茯苓为补气药与利水渗湿药的组合,针对气虚水停,温煦传送无力所致便秘;羌活、防风、桂枝、川芎为发散风寒药与活血化瘀药组合,主要针对外感寒邪与瘀血停滞两类病理因素;第3类方剂主要组成有黄连与黄柏清热燥湿药配伍,针对湿热雍滞,气机内停所致便秘;栀子,桔梗,柴胡为清热泻火药、清化热痰药与发散风热药组合,针对热盛津伤所致便秘;第4类方剂组成为陈皮、木香为理气药组合,针对情志失调,气机郁滞的病理因素;香附、沉香、青皮、枳实、厚朴、槟榔为理气药与化湿药组合,针对湿气瘀滞,气机不通所致便秘;枳实、半夏为理气药与温化寒痰药组合,针对寒凝气滞,痰饮内停两类病理因素;第5类中药聚类相效果不理想,但其中芒硝与麦冬为攻下药与补阴药的组合,针对津液亏损,大肠失润所致便秘。结果显示系统聚类聚为5类时,5类治疗便秘方剂中主要药物组成虽有很多相似之处,但第1、2类方剂的药物组成以常用药物为主,而第3、4类方剂的药物组成中除了常用药物还有许多特殊药物。经与相关中医传统理论及其他相似研究对比,可以认为由系统聚类算法所确定的5类药物组成与已有的理论研究及临床研究结果之间符合度较好,不存在明显矛盾,并且在进行数据挖掘时还总结出治疗便秘的特殊药物有陈皮、香附、桔梗、半夏、麝香、郁金、乌头、三棱、吴茱萸等,对治疗便秘方剂的理论与实践研究具有一定的推动作用。其次,基于聚类分析,本研究演化得到治疗便秘的核心组合10个,分别为大黄、甘草;当归、地黄、芍药;人参、白术、茯苓;羌活、防风、川芎、桂枝;黄连、黄柏;栀子、桔梗、柴胡;陈皮、木香;青皮、枳实、厚朴、沉香;枳实、半夏;细辛、白芷、生姜,这10个核心组合同样印证饮食不节、情志失调、年老体虚、感受外邪会造成热结、气滞、寒凝、气血阴阳亏虚,对便秘的发生发展不容忽视。
3.4 关联规则分析
关联规则又称关联挖掘,能够反映两药之间的配伍紧密程度,、相关性或因果结构,依赖关系网络分析可以发现某些属性同时出现的规律和模式,进而发现核心药物,两者结合则可以发现核心药组[13]。本研究为探索治疗便秘运用Apriori算法对高频药物进行关联规则分析,为探索治疗便秘方剂中新的组方规律,本研究将设置参数调为支持度≥10%,置信度≥55%,共得出32条二元矩阵的药对与药组关联规则。见表10。结果分析可见,大黄→黄芩、栀子;大黄→芒硝;甘草→栀子、黄芩;大黄→黄连;黄芩→栀子;大黄→甘草;黄芩→甘草为已知治疗便秘常用药对[14]。由此,我们更进一步将设置参数调为支持度≥10%,置信度≥60%,共得出17条药对与药组关联规则,支持度较高的药物组合有大黄→栀子;甘草→黄芩;甘草→大黄;甘草→川芎。这些药对与药组主要是补虚药、活血化瘀药、清热药、泻下药的不同组合,如泻下药→清热药(大黄→栀子);补虚药→清热药(甘草→黄芩);补虚药→活血化瘀药(甘草→川芎);补虚药→泻下药(甘草→大黄)。上述结果体现了治疗便秘的泻热、温散、通导、益气温阳与滋阴养血等治法。大黄→槟榔;当归→地黄;甘草→陈皮;羌活→防风;芍药→当归是现今尚未总结的隐性结论,值得进行进一步讨论。
3.5 创新点与研究不足
3.5.1 创新点分析
由治疗便秘组方为切入点,对《中国方剂数据库》相关内容进行了系统梳理并建立治療便秘的2次数据库,综合运用Excel 2016、SPSS 19.0统计软件与SPSS 14.2统计软件等数据挖掘软件,运用因子分析、频数统计、系统聚类分析及关联规则分析等手段,依据药物类别→单味药→药对或药组→方剂的顺序,从局部到整体的不同角度进行研究治疗便秘组方的药类分析和用药规律,探讨其功效、主治、药对配伍等相关理论,验证部分中药在治疗便秘方剂配伍研究中的合理性与可行性,为发挥中医药治疗优势,提高便秘的临床治疗效果提供可靠的数据支持。此外,通过聚类分析结果显示,治疗便秘的核心类别有10类,分别为大黄、甘草;当归、地黄、芍药;人参、白术、茯苓;羌活、防风、川芎、桂枝;黄连、黄柏;栀子、桔梗、柴胡;陈皮、木香;青皮、枳实、厚朴、沉香;枳实、半夏;细辛、白芷、生姜,同时也印证了补虚药、解表药、泻下药以及理气药对于便秘治疗的有效性。
3.5.2 研究不足分析
本研究的数据受国家人口与健康科学数据共享平台提供的《中国方剂数据库》支持,其中共收录了万余首方剂数据,符合数据挖掘技术对数据源数据量大的基本要求。在研究过程中,我们发现了存在两首方剂的名称相同的情况。通过查阅古籍发现,方剂数据库录入的主治与古籍记载不完全一致等情况,因此可能会对数据挖掘研究造成偏倚,从而影响结论的可靠性。其次,从数据挖掘角度考虑,如果能收集到更多治疗便秘的方剂信息并做好规范化数据处理,对治疗便秘方剂的数据挖掘就能更加全面、更加准确。此次对治疗便秘方剂的数据挖掘主要选择了频数分析、因子分析、系统聚类分析、关联规则分析等数据挖掘方法,对于发现频率较高的隐含数据信息效果较好,但无法研究出现频率较低的信息。由此可见,临床实践上由医家对某方面的独特认识而产生的一些特殊的数据项,尽管其出现频率不高,但确实重要,不能被忽视。基于关联规则分析,我们虽然也试图通过降低最小支持度来减小算法本身的缺陷,但不可否认的是这依然是目前所存在的一大难题。 4 小结
本研究通过对方剂专题服务数据中治疗便秘方剂进行筛选,得到二次数据库,采用频数分析、因子分析、系统聚类分析和关联规则分析等数据挖掘方法,对治疗便秘的方剂进行数据挖掘分析。
结果显示,补虚药、泻下药、理气药、解表药化痰平喘药以及活血化瘀药在便秘的使用中占有较大比重。便秘治疗总以扶正祛邪,恢复大肠传导功能为主。治疗时以润肠清热为基本原则,又可根据病性的虚实,分别予以泻热、温散、通导、益气温阳或是滋阴养血之法。进行数据挖掘时还总结出治疗便秘的特殊药物有陈皮、香附、桔梗、半夏、麝香、郁金、乌头、三棱、吴茱萸等。大黄→槟榔;当归→地黄;甘草→陈皮;羌活→防风;芍药→当归是现今尚未总结的隐性结论,值得进行进一步讨论。数据挖掘适用于治疗便秘方剂的研究,我们通过数据挖掘技术,量化地挖掘出便秘常用药物、特殊药物以及药对,以期通过直观数据的形式为治疗便秘提供临床参考,也可为科研提供研究思路。
5 致谢
本组全体成员对提供此次比赛机会的主办方国家科技基础条件平台中心表示由衷的感谢,同时,感谢国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的中国方剂数据库,感谢CNKI提供的文献查询支持,感谢本组此次比赛中所引用书籍、文献的主编及作者,感谢各位评委老师对本组作品的悉心评阅,感谢学校给予浓厚的学术氛围。最后,再一次真诚的感谢我们的父母以及关心、帮助过我们的老师和同学,他们宝贵的意见是我们灵感和动力的源泉。
参考文献
[1]吴勉华,王新月.中医内科学[M].北京:中国中医药出版社,2012.
[2]李佳丽,颜立志,季田,等.主成分分析古医籍中肝癌类证候组方规律[J].中国中西医结合外科杂志,2016,22(6):523-528.
[3]许仲宁.系统聚类关联分析大肠癌放射性肠炎组方规律[J].光明中医,2018,33(5):753-754,后插1,封3.
[4]满达,吴超群,艳红,等.基于关联分析的蒙医萨病方剂组方规律研究[J].中国民族医药杂志,2017,23(7):46-47.
[5]李顺保.中药别名速查大辞典[M].北京:学苑出版社,1997:65.
[6]陈蔚文.中药学[M].2版.北京:人民卫生出版社,2013:73.
[7]江苏新医学院.中药大辞典[M].上海:上海人民出版社,1977:87.
[8]李霞,朱思敏,李防栋.刘绍能主任治疗便秘经验[J].医学信息,2015,28(41):362-362.
[9]张磊.舒芬太尼麻醉用于心血管手术的多中心临床研究[J].中国卫生产业,2014,12(3):108-109.
[10]阳婷婷,唐轶洋,张兴安.舒芬太尼与瑞芬太尼复合丙泊酚全凭静脉麻醉用于神经外科手术效果与安全性的系统评价[J].中国循证医学杂志,2013,13(12):1492-1499.
[11]吴化宇,丁婕,雒朝君,等.基于验证性因子分析的中医工作满意度量表研制[J].中国卫生统计,2019,36(1):92-95.
[12]潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014:328-329.
[13]陈文莉,李文林,史勤,等.基于关联规则及复杂网络分析古医籍中乳腺癌的用药规律[J].南京中医药大学学报,2018,34(6):625-629.
[14]石强.基于数据挖掘对柴胡类方方证规律的研究[D].北京:北京中医药大学,2012.
(2018-10-30收稿 責任编辑:杨觉雄)
关键词 数据挖掘;便秘;配伍规律;系统聚类分析;关联规则分析
Abstract Objective:To analyze the compatibility rule of Chinese Prescription Database in the treatment of constipation,and to provide basis for clinical treatment of constipation.Methods:Based on the screening of formula in the treatment of constipation in the Chinese Prescription Database,we collected and analyzed the prescription by frequency analysis,factor analysis,system clustering,association rule analysis and other data mining methods.Results:A total of 287 prescriptions for constipation were screened,involving 211 Chinese herbs,and the most frequent one was Radix Glycyrrhizae(109 times),followed by Radix et Rhizoma Rhei(103 times).Factor analysis can extract 25 principal components.The cluster number of 5 kinds was good,and commonly used drugs were Radix et Rhizoma Rhei,Radix Scutellariae,Radix Angelicae Sinensis,Paeonia Lactiflora,Pericarpium Citri Reticulatae,Radix Aucklandiae,Radix Rehmanniae Recens,Radix Ginseng,etc.,and 10 core combinations were obtained.The correlation analysis showed that Radix et Rhizoma Rhei combined with Radix Scutellariae and Fructus Gardeniae; Radix et Rhizoma Rhei with Natrii Sulfas; Radix Glycyrrhizae with Fructus Gardeniae and Radix Scutellariae; Radix et Rhizoma Rhei with Rhizoma Coptidis were known drug pair.Conclusion:The drugs of formula for constipation in Chinese Prescription Database were mainly tonifying deficiency,relieving superficies,clearing away heat,regulating qi,purging purgation and eliminating phlegm and relieving wheezing.And Radix et Rhizoma Rhei→ Semen Arecae; Radix Angelicae Sinensis→ Radix Rehmanniae Recens; Radix Glycyrrhizae→ Pericarpium Citri Reticulatae; Rhizoma et Radix Notopterygii→ Radix Saposhnikoviae; Paeonia Lactiflora→Radix Angelicae Sinensis are worthy of further discussion,which will provide some reference for the research and development of new drugs of TCM for constipation.
Key Words Data mining; Constipation; Formulating rules; Hierarchical clustering; Association rules
中圖分类号:R243;R574文献标识码:Adoi:10.3969/j.issn.1673-7202.2019.08.054
便秘是指大肠传导功能失常,导致大便秘结,排便周期延长;或周期不长,但粪质干结,排便困难;或粪质不硬,虽有便意,但排出不畅的病证[1]。《黄帝内经》首载便秘之症,称其为“后不利”“大便难”。汉·张仲景《伤寒杂病论》中将便秘称为“脾约”。刘完素首倡实秘、虚秘之别,《素问病机气宜保命集·泻痢论》载:“凡脏腑之秘,不可一例治疗,有虚秘,有实秘,胃实而秘者,能饮食小便赤……胃虚而秘者,不能饮食,小便清利”。而便秘一名首见于清代沈金鏊的著作《杂病源流犀烛》中,并沿用至今。络脉从经脉分出后,逐级细分为别络至缠络、系络直至其末端孙络。随着络脉分支愈加细窄迁曲,络中气血的运行渐趋缓慢,一旦邪客络脉,络中气血的输布环流将受到影响,易致络脉瘀滞状态。气化功能失常,络气郁滞,或络气虚乏推运无力而滞,气化不利则津凝为痰,气失流畅则血行涩滞,痰瘀阻滞,络脉由滞到瘀,气血瘀塞不通。痰瘀阻络进一步影响气的升降出入运动而加重气滞。大肠传化功能的正常运行以及大便的通畅调合依赖于气机运行的调畅。例如肺主一身之气,与大肠相表里,若肺气失宜,壅滞不降,大肠传导阻滞则发为便秘。中药方剂是中医治疗的主要手段,基于博大而深厚的传统理论,其组成配伍规律庞杂多变。目前,基于数据挖掘技术对中医药方剂的研究主要集中于药证结合、中药组合、方剂配伍以及核心方药的发现方面。 基于络病理论,我们以国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的《中国方剂数据库》为检索数据库,应用频数分析、因子分析[2]、系统算法聚类分析[3]以及Apriori算法关联规则分析[4]等数据挖掘技术对治疗便秘方剂进行中药组方用药配伍规律分析,筛选所有便秘方剂中涉及的高频中药并从其药性、四气五味、归经配伍特点等方面加以探讨和研究,以期为治疗便秘方剂的理论知识及临床治疗便秘的组方用药提供思路,进而提高临床治疗效果。
1 资料与方法
1.1 数据来源
选取国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的《中国方剂数据库》中的方剂专题服务数据,包括方剂名称、药物组成、功效、主治。
1.2 数据筛选
以《中国方剂数据库》中的方剂专题服务数据为检索数据库,以方剂的主治、功效为依据,主治中明确载有脾约、闭、阴结、阳结、虚秘、气秘、风秘、热密、寒秘、大便不利、大便不通等字样者,或证候表现具有便秘症状者均在收录之列。对于方剂主治过于庞杂且组方用药对便秘缺乏针对性的条目,原则上不予以收录。
1.3 中药名称规范
参照《中药别名速查大辞典》[5]对中药别名及俗称予以规范;参照全国高等中医药院校“十二五”规划教材《中药学》[6]《中药大辞典》[7]内容予以规范,并对其中药功效进行归类。具体包括以下几个方面:1)中药别名和俗称:如朴硝归为芒硝,锦纹归为大黄等;2)中药合写或出现方剂名:如三白汤、三黄汤、栀子豉汤、六一散等将其补全;3)中药炮制或产地名称:如茅苍术、北苍术归为苍术,汉防己归为防己,南木香归为木香,川柴胡归为柴胡等;4)药名书写不规范或方剂组成相同:如将诃子归为诃梨勒等。中药名称规范化处理见附表1。
1.4 数据录入
将所纳入方剂按照表1格式进行录入,如果该方剂内含有此味中药则记录为“1”,反之,没有此味中药则为“0”。进行关联规则分析时,须将表1的数据格式进行转换,即将“1”“0”分别用“T”“F”替代并保存。
1.5 数据分析
应用频数及高频药物频率进行数据挖掘分析便秘方剂所有组成中药的构成情况,出现频数按照从高到低的顺序排序;应用因子分析挖掘高频药物的特征值、贡献率和综合得分;采用聚类分析中的系统聚类算法挖掘治疗便秘方剂的常用中药;采用关联规则分析中的Apriori算法挖掘高频中药药对之间的配伍关系。
2 结果
2.1 药物使用频次、频率分析
按照上述标准筛选后,得到明确可用于治疗便秘的方剂共287首,其中涉及中药211味,药物使用总频数达2 535次。通过频数頻率统计,单味药中使用频率最高的是甘草,共使用109次,使用频率为4.30%;大黄次之,共使用103次,使用频率为4.06%。使用频率排列前10位的中药依次为:甘草、大黄、黄芩、当归、芍药、陈皮、木香、地黄、桂枝、枳实。以单味药使用频数≥平均频数(使用频数≥12次)的69味中药为本次数据挖掘的高频药物。见表2。
2.2 高频药物性味、归经分析
按照《中药学》与《中药大辞典》统计高频药物四气、五味及归经的频数频率。见表4、表5、表6。其中,温性药物使用频率最高,达26.64%;寒性药物次之,达20.87%。五味属性中,辛味、苦味、甘味药物使用频数最高,均大于500次,其使用频率依次为33.38%,31.79%,21.58%,累计频率超过80%。归经属性中排列前5位的为脾经、肺经、胃经、肝经、心经。
2.3 高频药类使用频数、频率分析
将高频药物按照《中药学》与《中药大辞典》的药物分类标准进行分类,共得到药物类别16项,总频数为1 958次。见表3。由表3可见,补虚药使用频数最高,达331次,占总使用频数的17.50%;解表药次之,使用频数达305次,占总使用频数的16.13%;清热药使用频数达295次,占总使用频数的15.60%,位居第3位。使用频率排列前6的药类依次为:补虚药、解表药、清热药、理气药、化痰止咳平喘药、泻下药,在高频药物的累计频率中高达79.00%,可见历代治疗便秘的方剂涉及的药物种类、数量均较广泛,具体用药则较为集中。
2.4 因子分析结果
运用SPSS 19.0统计软件对高频药物进行因子分析,首先进行KMO和Bartlett的检验。见表7。KMO统计量为0.715(>0.5),Bartlett球形检验P=0.000(<≈0.05),说明药物间相关程度较好,适合做因子分析。前25个公因子累计方差贡献率达71.141%,说明可以用该25个公因子进行代替。见表8。运用最大方差法(即具有Kaiser标准化的正交旋转法)进行旋转,旋转在25次迭代后收敛,得到相对较好效果,提取出各公因子中载荷量>0.4者,若提出的变量在多个公因子中同时出现,说明其不能作为公因子代表,宜排除,得出结果:黄连(0.694)、栀子(0.685)、黄柏(0.679)、天花粉(0.664)、连翘(0.565)、玄参(0.514)在第一因子P1上有较高的载荷;白僵蚕(0.824)、天麻(0.784)、麝香(0.574)在第二因子P2上有较高的载荷;荆芥(0.729)、苍术(0.643)、葛根(0.632)在第三因子P3上有较高的载荷,以此类推,详见附表3。由旋转成分矩阵可写出每个成分的因子表达式,BX1=0.334×F1+0.111×F2+0.238×F3-0.173×F4-0.076×F5+……+0.180×F21+0.029×F22+0.182×F23+0.029×F24-0.211×F25。以此类推,可以得到其余BX2~BX69的表达式。依据个体因子F1中每个指标所对应的系数,得到个体因子F1的表达式,F1=-0.058×BX1+0.072×BF2+0.105×BX3+0.056×BX4-0.073×BX5+……+0.214×BX64-0.057×BX65-0.016×BX66-0.001×BX67-0.051×BX68+0.073×BX69。以此类推,可以得到其余F2~F25的表达式。碎石图见图1,旋转载荷见图2。 2.5 系统聚类分析结果
运用SPSS 19.0统计软件对高频药物进行系统聚类分析,聚类方法为Ward法,变量间距离定义使用平方Euclidean距离,聚类结果见图3。将结果聚为5大类较为合理,分别是第1类:大黄、甘草;第2类:1组:当归、地黄、芍药;2组:人参、白术、茯苓;3组:羌活、防风、川芎、桂枝;第3类:1组:黄连、黄柏;2组:栀子,桔梗,柴胡;3组:黄芩;第4类:1组:陈皮、木香;2组:香附、沉香、青皮、枳实、槟榔、厚朴;3组:枳壳、半夏;第五类:1组:芒硝、麦冬;2组:其他。演化得到10个核心组合结果见表9。
2.6 关联规则分析结果
运用SPSS 14.2统计软件进行高频药物的关联规则分析,设置参数:最低条件支持度=10%,最小规则置信度=55%,最终得到药物组合共32组,并据此分析结果进一步绘制出关联网络图。见表10和图4。分析可知,在2味药的关联规则中,甘草→黄芩和大黄→黄芩的支持度均为23.34%,并列第1位,其中甘草→黄芩的置信度更高,为58.21%,大黄→黄芩的置信度相对稍低,为56.72%;甘草→芍药的支持度为18.47%,置信度为67.92%,排列第3位。在3味药的关联规则中,大黄→黄芩、甘草的支持度最高,达18.47%,其置信度为67.92%;栀子→黄芩、大黄的支持度次之,达13.24%,其置信度为65.79%。
3 讨论
《兰室秘藏·大便结燥门》载:“若饥饱失节,劳役过度,损伤胃气,及食辛热味厚之物,而助火邪,伏于血中,耗散真阴,津液亏少,故大便结燥”;《扁鹊心书·便秘》载:“老人气虚,及妇人产后血少,致津液不行,不得通流,故大便常结”。《名医杂著》载:“证属形气病,形气俱不足,脾胃虚弱,津血枯涸而大便难尔”。由此可见阴阳气血不足均是导致便秘的内在基础,感受外邪是便秘发生的外在条件,热结、气滞、寒凝、津液耗伤为其病因根本,病位首在大肠,并同时与肺、脾、胃、肝、肾等脏腑关系密切。本研究依据国家人口与健康科学数据共享平台提供的方剂专题服务数据,筛选出与便秘相关的287首方剂,采用频数分析、因子分析、系统聚类、关联规则分析等数据挖掘方法,运用SPSS 19.0统计软件与SPSS 14.2统计软件等数据挖掘软件总结出治疗便秘的方剂用药及配伍规律,以期为便秘的临床治疗提供思路。
3.1 中药频数分析
通过对治疗便秘287首方剂所涉及到的69味高频药物用药分析可见,方剂中所涉及到的药物分类主要以补虚药、泻下药、理气药、解表药化痰平喘药以及活血化瘀药等为主。单味药使用频数≥50的药物有甘草、大黄、黄芩、当归、芍药以及陈皮。上述药物分类以及单味药的使用基本能够体现历代医家对便秘相关用药规律的认识。饮食不节、劳役过度、脾胃气虚等导致大肠通降失调,造成传导不利是便秘的基本病机。在便秘的发展过程中,热盛津伤占有主要影响地位[8]。此外,胃肠虚寒和肺脏功能失调亦是导致便秘的原因之一。因此,便秘治疗时以润肠清热为基本原则,又可根据病性的虚实,分别予以泻热、温散、通导、益气温阳或是滋阴养血之法。通过对287首治疗便秘方剂用药规律的研究显示,其结果恰如《景岳全书·秘结》曰:“阳结证,必因邪火有余,以致津液干燥。大肠热盛,燥屎内结。泻下热结,热去结散便通”。用药多以补阴药、泻下药为主。又如《伤寒名案选新注》载李士材医案:“治吴君明,伤寒六日,谵语狂笑,头痛有汗,大便不通,小便自利。方今仲冬,宜与桂枝汤……明日大便自通”巧用解表药治疗便秘[9]。清·陈士铎《石室秘录·大便闭结》云:“大便闭结者,人以为大肠燥甚,谁知是肺气燥乎?肺燥则清肃之气不能下行于大肠”[10]。明确指出便秘与肺有关,用药多以化痰平喘药与理气药等为主,契合便秘的治疗理念。就使用频数较高的药类分析来看,补虚药使用频次最高,其中以补气、补血药为主,代表药为当归、芍药、人参、白术、甘草等。解表药紧随其次,以桂枝、羌活和柴胡等药物为主。泻下药以大黄和芒硝等攻下药为主。清热药、理气药、化痰止咳平喘药、利水渗湿药以及活血化瘀药的使用频率也较高,具有一定的研究意义。因此便秘治疗总以扶正祛邪,恢复大肠传导功能为主。在便秘治疗中,补虚药与解表药占有重要地位,常配伍清热药,辅以理气、化痰、泻下药使用。
3.2 因子分析
因子分析的目标是通过发掘隐藏在数据下的一组较少的、更为基本的无法观测的变量,来解释一组可观测变量的相关性。这些虚拟的、无法观测的变量称作因子(每个因子被认为可解释多个观测变量间共有的方差,因此准确来说,他们应该称作公共因子)[11]。利用因子分析的意义在于比较分析治疗便秘方剂中的药物组方规律,通过因子载荷系数筛选出在治疗便秘中发挥功效的主要中药类别及单味中药。本研究显示,KMO统计量=0.715(满足>0.5的检测标准),由于提取主成分过多导致前25个主成分(F1~F25)对应的特征根介于1.273与3.760之间,彼此区别不是很大,不能很好的解释原始变量,概其原由是治疗便秘方剂过于庞杂所致。参照附表3,对25个主成分初步提取,例如黄连(0.694)、栀子(0.685)、黄柏(0.679)、天花粉(0.664)、连翘(0.565)、玄参(0.514)在F1上有较高的载荷;白僵蚕(0.824)、天麻(0.784)、麝香(0.574)在F2上有较高的载荷;荆芥(0.729)、苍术(0.643)、葛根(0.632)在F3上有较高的载荷;陈皮(0.758)、青皮(0.718)在F5上有較高载荷。从药类使用上分析,基本契合治疗便秘的常用药类,即以解表药、祛风湿药、补虚药、理气药、活血化瘀药、清热药、平肝熄风药、化痰止咳平喘药以及温里药等为主。因此,作为一种数学计算方法,因子分析在治疗便秘方剂的客观的定量评价方面具有优势,从另一个侧面为中医药治疗便秘提供了一个新的尝试性研究方法,为便秘方剂的临床应用提供了参考性指标。 3.3 系统聚类分析
系统聚类是实际工作中使用的最多的一种聚类方法,它具有十分明显的优点:可以对样品聚类,也可以对变量聚类。通过将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或性质接近(针对变量聚类)的两类合并为一类;再从这n-1类中找到最接近的2个类合并,以此类推,直到所有的样品或变量被合为一类。整个过程可以绘成聚类图,按图和具体问题来决定分类[12]。本研究运用系统聚类分析法,在通过对治疗便秘方剂数据的多次聚类后,结合治疗便秘方剂的药物组成分析,系统聚类模型显示,治疗便秘方剂比较好的聚类数目为5类。分析可见,第1类方剂主要由大黄、甘草等药物组成,聚一类以泻下药与补虚药相配伍,主要针对热结下焦与脾胃气虚两类病理因素;第2类方剂组成有当归、地黄、芍药均为补血药,针对阴血虚,润泽荣养不足所致便秘;人参、白术、茯苓为补气药与利水渗湿药的组合,针对气虚水停,温煦传送无力所致便秘;羌活、防风、桂枝、川芎为发散风寒药与活血化瘀药组合,主要针对外感寒邪与瘀血停滞两类病理因素;第3类方剂主要组成有黄连与黄柏清热燥湿药配伍,针对湿热雍滞,气机内停所致便秘;栀子,桔梗,柴胡为清热泻火药、清化热痰药与发散风热药组合,针对热盛津伤所致便秘;第4类方剂组成为陈皮、木香为理气药组合,针对情志失调,气机郁滞的病理因素;香附、沉香、青皮、枳实、厚朴、槟榔为理气药与化湿药组合,针对湿气瘀滞,气机不通所致便秘;枳实、半夏为理气药与温化寒痰药组合,针对寒凝气滞,痰饮内停两类病理因素;第5类中药聚类相效果不理想,但其中芒硝与麦冬为攻下药与补阴药的组合,针对津液亏损,大肠失润所致便秘。结果显示系统聚类聚为5类时,5类治疗便秘方剂中主要药物组成虽有很多相似之处,但第1、2类方剂的药物组成以常用药物为主,而第3、4类方剂的药物组成中除了常用药物还有许多特殊药物。经与相关中医传统理论及其他相似研究对比,可以认为由系统聚类算法所确定的5类药物组成与已有的理论研究及临床研究结果之间符合度较好,不存在明显矛盾,并且在进行数据挖掘时还总结出治疗便秘的特殊药物有陈皮、香附、桔梗、半夏、麝香、郁金、乌头、三棱、吴茱萸等,对治疗便秘方剂的理论与实践研究具有一定的推动作用。其次,基于聚类分析,本研究演化得到治疗便秘的核心组合10个,分别为大黄、甘草;当归、地黄、芍药;人参、白术、茯苓;羌活、防风、川芎、桂枝;黄连、黄柏;栀子、桔梗、柴胡;陈皮、木香;青皮、枳实、厚朴、沉香;枳实、半夏;细辛、白芷、生姜,这10个核心组合同样印证饮食不节、情志失调、年老体虚、感受外邪会造成热结、气滞、寒凝、气血阴阳亏虚,对便秘的发生发展不容忽视。
3.4 关联规则分析
关联规则又称关联挖掘,能够反映两药之间的配伍紧密程度,、相关性或因果结构,依赖关系网络分析可以发现某些属性同时出现的规律和模式,进而发现核心药物,两者结合则可以发现核心药组[13]。本研究为探索治疗便秘运用Apriori算法对高频药物进行关联规则分析,为探索治疗便秘方剂中新的组方规律,本研究将设置参数调为支持度≥10%,置信度≥55%,共得出32条二元矩阵的药对与药组关联规则。见表10。结果分析可见,大黄→黄芩、栀子;大黄→芒硝;甘草→栀子、黄芩;大黄→黄连;黄芩→栀子;大黄→甘草;黄芩→甘草为已知治疗便秘常用药对[14]。由此,我们更进一步将设置参数调为支持度≥10%,置信度≥60%,共得出17条药对与药组关联规则,支持度较高的药物组合有大黄→栀子;甘草→黄芩;甘草→大黄;甘草→川芎。这些药对与药组主要是补虚药、活血化瘀药、清热药、泻下药的不同组合,如泻下药→清热药(大黄→栀子);补虚药→清热药(甘草→黄芩);补虚药→活血化瘀药(甘草→川芎);补虚药→泻下药(甘草→大黄)。上述结果体现了治疗便秘的泻热、温散、通导、益气温阳与滋阴养血等治法。大黄→槟榔;当归→地黄;甘草→陈皮;羌活→防风;芍药→当归是现今尚未总结的隐性结论,值得进行进一步讨论。
3.5 创新点与研究不足
3.5.1 创新点分析
由治疗便秘组方为切入点,对《中国方剂数据库》相关内容进行了系统梳理并建立治療便秘的2次数据库,综合运用Excel 2016、SPSS 19.0统计软件与SPSS 14.2统计软件等数据挖掘软件,运用因子分析、频数统计、系统聚类分析及关联规则分析等手段,依据药物类别→单味药→药对或药组→方剂的顺序,从局部到整体的不同角度进行研究治疗便秘组方的药类分析和用药规律,探讨其功效、主治、药对配伍等相关理论,验证部分中药在治疗便秘方剂配伍研究中的合理性与可行性,为发挥中医药治疗优势,提高便秘的临床治疗效果提供可靠的数据支持。此外,通过聚类分析结果显示,治疗便秘的核心类别有10类,分别为大黄、甘草;当归、地黄、芍药;人参、白术、茯苓;羌活、防风、川芎、桂枝;黄连、黄柏;栀子、桔梗、柴胡;陈皮、木香;青皮、枳实、厚朴、沉香;枳实、半夏;细辛、白芷、生姜,同时也印证了补虚药、解表药、泻下药以及理气药对于便秘治疗的有效性。
3.5.2 研究不足分析
本研究的数据受国家人口与健康科学数据共享平台提供的《中国方剂数据库》支持,其中共收录了万余首方剂数据,符合数据挖掘技术对数据源数据量大的基本要求。在研究过程中,我们发现了存在两首方剂的名称相同的情况。通过查阅古籍发现,方剂数据库录入的主治与古籍记载不完全一致等情况,因此可能会对数据挖掘研究造成偏倚,从而影响结论的可靠性。其次,从数据挖掘角度考虑,如果能收集到更多治疗便秘的方剂信息并做好规范化数据处理,对治疗便秘方剂的数据挖掘就能更加全面、更加准确。此次对治疗便秘方剂的数据挖掘主要选择了频数分析、因子分析、系统聚类分析、关联规则分析等数据挖掘方法,对于发现频率较高的隐含数据信息效果较好,但无法研究出现频率较低的信息。由此可见,临床实践上由医家对某方面的独特认识而产生的一些特殊的数据项,尽管其出现频率不高,但确实重要,不能被忽视。基于关联规则分析,我们虽然也试图通过降低最小支持度来减小算法本身的缺陷,但不可否认的是这依然是目前所存在的一大难题。 4 小结
本研究通过对方剂专题服务数据中治疗便秘方剂进行筛选,得到二次数据库,采用频数分析、因子分析、系统聚类分析和关联规则分析等数据挖掘方法,对治疗便秘的方剂进行数据挖掘分析。
结果显示,补虚药、泻下药、理气药、解表药化痰平喘药以及活血化瘀药在便秘的使用中占有较大比重。便秘治疗总以扶正祛邪,恢复大肠传导功能为主。治疗时以润肠清热为基本原则,又可根据病性的虚实,分别予以泻热、温散、通导、益气温阳或是滋阴养血之法。进行数据挖掘时还总结出治疗便秘的特殊药物有陈皮、香附、桔梗、半夏、麝香、郁金、乌头、三棱、吴茱萸等。大黄→槟榔;当归→地黄;甘草→陈皮;羌活→防风;芍药→当归是现今尚未总结的隐性结论,值得进行进一步讨论。数据挖掘适用于治疗便秘方剂的研究,我们通过数据挖掘技术,量化地挖掘出便秘常用药物、特殊药物以及药对,以期通过直观数据的形式为治疗便秘提供临床参考,也可为科研提供研究思路。
5 致谢
本组全体成员对提供此次比赛机会的主办方国家科技基础条件平台中心表示由衷的感谢,同时,感谢国家人口与健康科学数据共享平台和中国中医科学院中医药信息研究所提供的中国方剂数据库,感谢CNKI提供的文献查询支持,感谢本组此次比赛中所引用书籍、文献的主编及作者,感谢各位评委老师对本组作品的悉心评阅,感谢学校给予浓厚的学术氛围。最后,再一次真诚的感谢我们的父母以及关心、帮助过我们的老师和同学,他们宝贵的意见是我们灵感和动力的源泉。
参考文献
[1]吴勉华,王新月.中医内科学[M].北京:中国中医药出版社,2012.
[2]李佳丽,颜立志,季田,等.主成分分析古医籍中肝癌类证候组方规律[J].中国中西医结合外科杂志,2016,22(6):523-528.
[3]许仲宁.系统聚类关联分析大肠癌放射性肠炎组方规律[J].光明中医,2018,33(5):753-754,后插1,封3.
[4]满达,吴超群,艳红,等.基于关联分析的蒙医萨病方剂组方规律研究[J].中国民族医药杂志,2017,23(7):46-47.
[5]李顺保.中药别名速查大辞典[M].北京:学苑出版社,1997:65.
[6]陈蔚文.中药学[M].2版.北京:人民卫生出版社,2013:73.
[7]江苏新医学院.中药大辞典[M].上海:上海人民出版社,1977:87.
[8]李霞,朱思敏,李防栋.刘绍能主任治疗便秘经验[J].医学信息,2015,28(41):362-362.
[9]张磊.舒芬太尼麻醉用于心血管手术的多中心临床研究[J].中国卫生产业,2014,12(3):108-109.
[10]阳婷婷,唐轶洋,张兴安.舒芬太尼与瑞芬太尼复合丙泊酚全凭静脉麻醉用于神经外科手术效果与安全性的系统评价[J].中国循证医学杂志,2013,13(12):1492-1499.
[11]吴化宇,丁婕,雒朝君,等.基于验证性因子分析的中医工作满意度量表研制[J].中国卫生统计,2019,36(1):92-95.
[12]潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014:328-329.
[13]陈文莉,李文林,史勤,等.基于关联规则及复杂网络分析古医籍中乳腺癌的用药规律[J].南京中医药大学学报,2018,34(6):625-629.
[14]石强.基于数据挖掘对柴胡类方方证规律的研究[D].北京:北京中医药大学,2012.
(2018-10-30收稿 責任编辑:杨觉雄)