基于LLR融合基频与MFCC的说话人性别识别

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xieqi_1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于线性逻辑回归的方法,对利用基频和MFCC特征获得的分数进行融合来进行说话人的性别识别,其中包括了基于基频特征的单高斯模型和基于MFCC特征的混合高斯模型.采用语音库包括男性语音文件150个,女性语音文件190个.实验结果中识别率可高达97.65%,比传统单用基频或是MFCC特征的识别率都要高,具有更好的判别性能. A method based on linear logistic regression was proposed to fuse the speaker’s gender by fusion of the scores obtained from the fundamental frequency and the MFCC features, including single-Gaussian model based on fundamental frequency features and Gaussian mixture model based on MFCC The speech database includes 150 male voice files and 190 female voice files.The recognition rate in the experimental results can reach as high as 97.65%, which is higher than the recognition rate of the traditional single-frequency or MFCC features and has better discrimination performance .
其他文献
本文主要研究了《诗经》的一个重要主题,即农事诗。本文共分为三章。第一章就农事诗的概念和基本篇目作了简单的说明,将农事诗界定为:《诗经》中描述农事以及与农事直接相关
为研究水稻赤霉素20-氧化酶2(OsGA20ox2)基因的过量表达对水稻株高和生长发育的影响,通过RT-PCR扩增OsGA20ox2基因并构建该基因的过量表达载体pS12Q,采用农杆菌介导法遗传转
摘 要:本篇就LPG地下储库的存储技术,进行多方位的阐述,对地面工艺,及洞库原理进行了详细的介绍,并就LPG的发展前景进行了探讨。  关键词:LPG;洞库;竖井;裂隙水;巷道  液化石油气是石油产品之一。英文名称liquefied petroleum gas,简称LPG。是由炼厂气或天然气(包括油田伴生气)加压、降温、液化得到的一种无色、挥发性气体。由炼厂气所得的液化石油气,主要成分为丙烷、丙烯、
从图片看,这应是一块玛瑙石。它质地润泽,色调以温暖的橙红、紫红为主,右上角为乳白,观感十分靓丽。石头形态,加之适当安置,酷像一头咩咩呜叫、匆匆行走的小绵羊。小绵羊还未
本文通过对荣华二采区10
达尔富尔冲突为解释介入国内冲突的复杂性以及联合国迫切需要向更高效解决国际事务的方向改革提供了切实证据,联合国宪章第七章在解决各种问题方面通常负有诠释的作用。结合
20世纪60年代初,我国农村经济正经历严重困难时期,当时全国农村实行“一大二公”的人民公社制度,一切生产资料归公社集体所有,劳动力也由集体统一调配,农民的生产积极性和农
本文对觉公簋相关问题进行了研究。觉公簋是新近披露的一件有铭青铜器,由于铭文内容可以与天马----曲村遗址发现的相关青铜器、墓葬进行比照,对于厘清西周早期王年和早期晋史
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥