基于MFCC与基频特征贡献度识别说话人性别

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:sxiaohui8709252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种复杂场景下基于MFCC与基频特征贡献度的说话人性别识别方法.该方法有效融合了基于Mel频率倒谱系数的模板匹配方法和基音频率判别方法.实验语音数据库包括5 000个孤立词语音和1 260个带情感的语音.在安静环境下说话人的性别识别率可以达到98.88%,在信噪比为10dB的babble噪声下通过谱减法降噪后的识别率为90.2%.实验表明:说话人情绪对性别识别的影响较大,尤其是男声. A speaker gender recognition method based on the contribution of MFCC and fundamental frequency features in complex scenes is proposed.This method effectively combines template matching method and pitch frequency discrimination method based on Mel frequency cepstral coefficient.The experimental speech database includes 5 000 Isolated speech and 1 260 emotive speech.Under a quiet environment, the speaker’s gender recognition rate can reach 98.88%, and the recognition rate after spectral subtraction noise reduction under a babble noise with a signal-to-noise ratio of 10dB is 90.2%. Experiments show that the speaker’s mood has great influence on gender identification, especially male voice.
其他文献
合成了壳聚糖-透明质酸复合凝胶(壳聚糖15g/L,透明质酸1g/L,交联剂戊二醛用量为壳聚糖-透明质酸质量的30%,即4.8g/L,室温下放置24h),以改善单纯壳聚糖凝胶脆性较大、黏弹性及
复行为犯是相对于单一犯罪而言的一种特殊的犯罪形态,由于其行为结构的复杂性,因此,如何界定复行为犯的概念,复行为犯的着手时点是以前一行为还是后一行为为标准等问题,是研
OREC呼声高涨的背后实际上隐含着的是资源及其利益的博弈。
随着6C等专利联盟对中国DVD行业收取巨额专利使用费,专利联盟这一经济实体已引起了学者们的关注。本文从促进和阻碍技术创新等两个方面对专利联盟的微观机理进行研究,结果表
医院医护人员的职业暴露与防护一直以来都是医院工作的难点之一。消毒供应中心是医院内各种无菌物品的供应单位,也是最大的医疗污染集中地。供应室护理在职业过程中与许多有毒
城市化发展带来的一系列严重的雨洪问题给中国城市的发展模式和基础设施建设提出了挑战。毫无疑问,为应对挑战,绿色建筑应该担负起应有的责任。本文着重阐述了绿色建筑中雨水
道元《法华转法华》之传统(日)池田鲁彦提起道元(1200-1253),世人皆知其于镰仓时代初期,与荣西(1141-1215)所传禅宗共鸣,随荣西弟子明全(1184-1225)入宋留学,得天童山如净(1162-1227)曹洞宗真传后入福井县,为开创永平...
本文旨在探讨政府机关的信息化管理体制,分别从政府机关信息化管理机构设置的模式,政府机关信息化管理领导体制的类型,以及建立政府机关信息化管理体制应考虑的因素这三个方
本文以竹笋为原料,研究了提取方法不同对竹笋总膳食纤维的成分、结构、物化功能特性的影响;采用酶解法和化学法两种方法提取竹笋中的可溶性膳食纤维并对其性质进行测定;此外,
媒介融合已经成为媒介发展的大趋势,成为任何媒体生存和发展都要面对的媒介环境。作为媒介融合五大类型之一的战略融合已然成为传媒业之常态,并被认为是媒介市场发展趋势和必