论文部分内容阅读
类风湿关节炎是一种以侵袭性关节炎为主要表现的全身性自身免疫病,中医是在整体观念指导下辨证论治,尤其在治未病以及对并发症的治疗上,适当的规避了西医治疗中无法早期诊断早期治疗以及对并发症的忽视治疗等状况。而且,中药同西药相比,毒副作用较小,且不良反应较少,既可扶正固本、调节机体免疫功能,又可改善微循环、抗炎、镇痛,达到标本兼治的作用,更适合患者长期服用。“证候”是辨证论治的核心,发现证候理论中所蕴含的客观规律,构建辨证论治的规范依据,是中医证候学研究的方向。证候研究的难点在于:首先,中医临证辨证方法多样,证型不规范,难以进行证候标准化。第二,中医证候是一个非线性的复杂系统,多维多阶,无限组合,单纯运用还原的方法无法对其进行合理的阐释。第三,临床医生对证候的判定过程信息复杂且高度融合,具有模糊性的特点。第四,各症状对证候诊断的鉴别意义不等,中医证候难以量化和客观化。研究目的:中医临证中的证候诊断过程,是医生提取四诊信息中对证候鉴别有意义的症状,并将这些症状进行分类的过程,证候问题实质上就是中医症状的分类问题。数据挖掘领域中专门用于解决分类问题的方法被称为分类算法。本研究将随机森林算法引入到中医证候的研究中来,试解决症状的重要性计算和证型分类问题。研究方法:针对证候研究中证候信息非线性,高维高阶,模糊性,难以衡量各因素重要程度等问题,将数据挖掘领域中的分类算法引入到中医证候诊断的研究过程中来,运用随机森林对类风湿关节炎进行特征选择,并构建证候分类模型;为验证随机森林模型效能,采用支持向量机方法进行建模作为对比实验,对比两模型预测准确率。结果:1.本研究以类风湿关节炎为研究对象,搜集RA文献报道的中医有效辨证信息,参考现有中医证候分类标准,人工对辨证信息进行分型归类,并对各证型下属症状进行术语规范化处理,建立了一个“RA证-症”数据集。2.采用随机森林方法实现了对类风湿关节炎证型判别模型的构建,并对特征症状进行权重计算。3.采用支持向量机方法建立证型判别模型,两种模型准确率对比结果显示随机森林性能优异。结论:1.随机森林模型在中医证候建模过程中表现出了良好的性能,不仅准确率高,还能衡量症状在证候分类中的贡献程度,找出对类风湿关节炎证候分类最有影响的主要症状,研究结果同现行的证候特点相对比,有助于证候表述的完善,适合引入应用于证候规范化研究。2.本研究采用中医证候研究中应用较为成熟广泛的支持向量机方法对同一数据集进行分类建模作为对比实验,研究结果显示随机森林模型预测准确率同支持向量机具有可比性,而且模型性能更为稳定,这在一定程度上可以证明将随机森林方法引入用于证候研究具有可观前景。3.随机森林方法的一大显著优点是在建模过程中能对特征的重要性进行计算,体现在本研究中是实现了对类风湿关节炎证型分类的特征症状的重要性排序,筛选出了对证型判别最有意义的症状特征,这有助于更好的解释模型丰富证候的特异性表述,也为解决证候数据的冗余性提供了一种新的方法,而且为证候研究中的难点定量研究提供了一种新的可能性。