论文部分内容阅读
声诊是中医的四种主要诊断方法之一,它通过分析病人语音变化获知病人的生理和病理情况。传统中医声诊主要依赖于医师的听觉。医师容易受到环境,经验和自身主观感受等因素的影响,难以给出足够客观的结果。对患者的评价缺乏统一和量化的标准。数字化声诊系统是一套建立在计算机上的智能系统,它能够采集和分析病人语音并给出客观化和自动化的诊断。本文研究了五脏五音声诊信息的提取和识别。五脏五音声诊的方法在2000多年前的《黄帝内经》中即有记载。根据其理论,“宫”“商”“角”“徵”“羽”五音对应人体的五脏,医师通过分析病人的五音变异就可以获知其五脏病变情况。本课题采用了与五音对应的十个汉字的发音作为分析样本,通过特征提取和模式识别对病人的五脏病变做出诊断。所有语音样本均由上海中医药大学临床采集并提供。本文对病人的语音提取了梅尔倒谱系数,Bark小波变换,样本熵等特征,实验证明它们能够有效分辨五脏声诊中的六类样本。在特征分析中这些参数在病人与健康人之间也表现出了统计意义上的显著差异。随后,使用特征筛选方法确定了这些特征中的主要有效特征并形成了最优特征集。特征筛选处理降低了特征维数,提高了后续分类识别算法的效率。一个有效的数字化声诊系统需要一个优良的分类识别算法。本文在传统的多类支持向量机基础上提出了两方面的改进,一是引入了基于聚类算法的特征空间变换,使各个子支持向量机运行在不同的特征空间上,二是用神经网络代替了常见的投票表决策略。在公共数据集和中医声诊数据集上的实验表明,这些改进是有效的。实验中,五脏五音声诊数据集获得了75%的识别正确率,气阴虚数据集获得了80%的识别正确率。考虑到中医临床实践中兼证病例的存在,本文研究了多示例多标记学习方法在声诊中的应用。临床数据包含每个患者/a/,/o/,/e/,/i/,/u/五个元音,样本类型包括气虚、阴虚和气阴两虚患者。把每个病人的五音作为示例,病人的证型作为标记,多标记多示例框架为兼证的判别提供了一种新的解决方案。