婴儿啼哭声的特征分析与识别

被引量 : 0次 | 上传用户:magi9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对婴儿来说,啼哭声是一种通讯的方式,一个非常有限的,但类似成年人进行交流的方式。它也是一种生物报警器,向外界传达着婴儿生理和心理的需求。基于啼哭声声波携带的信息,婴儿的身体状况才能被确定,疾病才能被检测出来。因此,有效辨识啼哭声,成功地将婴儿啼哭声“翻译”成“成人语言”,让我们能够读懂啼哭声的含义,有重大的实际意义。由于婴儿啼哭声与语音的关联,现在有越来越多的研究人员着手将语音处理技术和模式识别的方法运用在婴儿啼哭声的分类上,随着语音处理技术的高速发展,也为婴儿啼哭声的识别提供了强有力的支持。本文对婴儿啼哭声的分类识别进行了一定程度的研究,所做的工作主要有以下几个部分:将婴儿与成年人在发声结构和发声原理上分别进行了比较,了解两者的异同。从婴儿啼哭声的特性上入手,采用合适的技术对其进行分析处理。数据库的建立。由于目前没有统一规范的婴儿啼哭声数据库,而且研究者所在的领域不同,对婴儿啼哭声分析的侧重点也不同,造成了对婴儿啼哭声类别的划分有多种方式。综合考虑各方面的因素,在实验中,对婴儿啼哭声是按照疼痛和非疼痛来进行划分。预处理分析过后,重点讨论婴儿啼哭声的参数提取。通过分析常用的特征参数,包括线性预测系数(LPC)、线性预测倒谱系数(LPCC)、Mel倒谱系数(MFCC)等,分析各自的优势和不足,选用MFCC参数用于婴儿啼哭声分析中,并选取不同的阶次来观察对疼痛的和非疼痛的婴儿啼哭声识别率的影响。考虑到婴儿声道构造独特,通常啼哭声的基音频率较高,而MFCC参数对婴儿啼哭声在其高频部分的信息提取工作不如在其低频部分的效果好,因此另外引用一种反向Mel频率倒谱系数,即IMFCC,这种参数对婴儿啼哭声的高频部分的信息获取具有很大的优势,与MFCC形成了优势互补。将MFCC与IMFCC两者结合使用,即形成组合特征,同样也选取不同的阶次来考察对疼痛的和非疼痛的婴儿啼哭声识别率的影响。最终,通过实验结果验证,使用组合特征的识别率要比单独使用一种参数时有所提高。对婴儿啼哭声的识别算法分析中,探讨了三种常用的识别算法,但根据当前样本较少、婴儿啼哭声的特性、以及运算量的大小三个方面的综合考虑,确定将在孤立词的识别中运用非常广泛的DTW算法用于对疼痛的和非疼痛的婴儿啼哭声的识别中。
其他文献
二战以后,社会民主党领导下的西欧各国率先实现了资本主义福利体制从一般社会福利向"福利国家"的转变,各国福利建设都取得了辉煌的成就,但这一政策在20世纪70年代以后陷入全
应用关联分析法 ,对 12个葡萄品种的 14个性状进行了综合评价 ,明确了最优品种。与等权关联度相比 ,加权关联度的评估结果更能反映出果实品质多个性状的实际表现。在专家打分
采用遥感信息图谱的方法对杭州湾滩涂资源进行了分析研究,以遥感影像、统计资料为基础数据,在GIS技术支持下,探讨了钱塘江河口及杭州湾滩涂资源变化信息图谱,为探索研究区滩
随着我国航空航天事业的快速发展,对电子设备内部电缆的相互位置进行分析,对电缆进行合理的分类布局,使之更适合于机载机柜的布线要求。
商品在某种意义上是一个跨越中西方文化连接商品和消费者的桥梁,随着越来越多的外国产品在中国上市,商标名的翻译已经成为一种跨文化交际形式。在商标名的翻译过程中,语言规
当前劳动力市场中的性别不平等主要表现在女性就业难、就业层次、收入和社会福利都相对较低。在市场转型的过程中,这种不平等的形成既有市场的因素,又有传统就业体制的影响,
技工学校学生来源较复杂,文化基础较差,而毕业后即直接进入社会,成为一名劳动者。那语文教学又如何针对学生的特点进行教学,让他们成为合格的毕业生?本文从语文教学的基础性
<正>2011年11月12—13日,"视野与方法 :中国当代文学研究现状"研讨会在上海大学新校区乐乎新楼召开。此次会议由上海大学"中国现当代文学"学科、《文学评论》编辑部、华东师
职业学校通过教学改革基本上形成了各自的教改模式,呈现不同教学特色,这种教学模式目前也都在实施过程中。其中一体化教学模式使课堂教学效果有了较大提高,能从根本上解决学
目的:总结重症吉兰-巴雷综合征机械通气患者救治成功的护理经验。方法:对28例重症吉兰-巴雷综合征致呼吸机麻痹患者及时行气管切开机械通气治疗及全程行营养支持的观察和综合