论文部分内容阅读
中医一直被认为是一门经验学科,因此研究中医学的规范化是中医学向现代化和科学化迈进的先决条件。近几年随着西医量表的发展和在临床上广泛应用,一些学者已将测量学和计量学的有关知识、方法应用于中医学研究,量表成为中医学规范化的重要手段之一。根据患者的证候和各项生命体征指标的信息,研制中医证候量表是构建中医临床诊断量表测评体系的重要内容,进一步促进中医诊断的标准化、科学化。本论文基于国家重点基础研究发展计划(973)课题——缺血性中风病证结合的诊断标准与疗效评价体系研究,以编制中风病证候诊断要素测评量表为背景,利用前瞻性大样本临床四诊信息调查研究所得数据,将特征选择方法引入到中医量表的条目筛选中,提高所得量表临床诊断的客观性、准确性。条目筛选是量表制作最为关键的环节,也是当前专家学者们研究的热点难点。而特征选择是从输入特征集合中选择使某种评估标准最优的特征子集,从数学本质上讲,特征选择要达到的目标跟条目筛选是一致的,都是从众多评价指标中挑选出最有代表性的子集,因此,特征选择的方法实现条目筛选已得到初步的应用。本文通过对特征选择算法的理解与回顾,对比分析传统条目筛选方法和基于特征选择的条目筛选方法入手,主要从以下几个方面展开研究:(1)分析课题背景,确定研究目标,提出本文要解决的主要问题。在对量表学原理进行简要概述的基础上,重点研究了量表制作的关键环节一条目筛选。同时,对传统条目筛选方法进行对比研究,详细介绍了常用的因子分析法和逐步判别法,并提出一种基于逐步判别的改进因子分析方法,给出了医学实验的仿真。(2)引入特征选择的方法。综述了特征选择的定义和主要研究方向,详细介绍了特征选择的两大类别,即Filter过滤式和Wrapper容器式,列举了一些常用的经典算法,研究了Filter和Wrapper组合式特征选择方法。(3)研究了特征选择在中风病证候诊断测评量表条目筛选中的具体应用,并用Matlab7.1实现了仿真。首先,成功地完成了数据的提取,为后续的研究提供了保障。然后,通过对相似性度量法的研究,类比并仿真了常见的四种距离,从与专家经验重合度和分类准确率上选择性能良好的Jaccard距离进行条目筛选。其次,应用粒子群优化算法学习并确定条目的权重,选择K近邻法为其评价函数。实验结果分析表明,从特征子集大小,分类准确率等多角度考察,该方法进行条目筛选比传统的方法具有良好的性能。