论文部分内容阅读
声诊是传统中医四诊的重要组成部分,它通过分析病人的语音变异来获得病人病变情况。传统中医过分依赖于医师的主观听觉,易受主观因素和环境的影响,使得诊断结果缺乏客观性。因此,使得声诊结果客观化、定量化就显得尤为重要。本文研究了中医声诊虚实证患者和正常人语音的特征提取和识别。古典中医认为,虚实证在声音上的表现为:语声高亢宏亮有力,声音连续者,多为实证:语声低微细弱,懒言,声音断续,或前重后轻,多属虚证。故可以通过声音来判别是虚证还是实证。根据上海中医药大学提供的虚实证和正常/a:/音样本,基于听觉生理和心理学的感知机理,提取了感觉线性预测系数PLP,RASTA_PLP,基于等效形带宽(ERB)提取了能量比和功率比特征。随后运用特征筛选算法对所提特征参数进行了筛选。用模式识别的分类算法支持向量机和集成学习算法Rotation Forest对筛选后的特征集做了分类识别,分别取得52.07%和52.3%的分类准确率。本文研究了中医声诊五脏疾病患者的五音的特征提取和识别。根据古典中医理论,宫、商、角、徵、羽五音与脾、肺、肝、心、肾五脏存在对应的关系,通过听觉感知五音的变异就可以诊断得出五脏的病变情况。而声音的感知过程与人耳的听觉系统密不可分。提取了感觉线性预测系数PLP,RASTA_PLP,基于等效形带宽(ERB)提取了能力比和功率比特征,运用模式识别的分类算法支持向量机和集成学习算法Rotation Forest对筛选后的特征集做了分类识别,分别取得80.83%和78.2%的分类准确率。另外以中医五音十字样本为研究对象,根据声品质原理,提取了声音响度、粗糙度、尖锐度、明亮度等参数,做了差异性分析和分类识别,支持向量机和集成学习算法Rotation Forest的分类准确率分别为55.43%和54.3%,取得一定的分类效果。本文基于语音情感识别研究了中医情志的识别。以德国柏林情感语音库为研究对象,提取PLP,RASTA_PLP,基于等效矩形带宽(ERB)提取了能力比和功率比特征,用支持向量机和集成学习算法Rotation Forest作分类识别,分别取得81.31%和82.22%的分类准确率,获得了较好的分类效果。