孤立词语音识别芯片中特征提取的算法研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wang3398218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,并出现了一些商用语音识别软件,例如IBM中文语音识别系统ViaVoice。但专用语音识别芯片的研究和开发还较少,这极大影响了语音识别技术的使用和推广。论文研究内容主要应用于小词汇量、非特定人、孤立词的汉语语音识别芯片。  论文深入分析了语音识别中预处理和特征参数的提取过程,并在各类算法上进行了优化,采用了适应于本课题语音信号特点的两N点实序列快速傅里叶变换方法,比分离的快速傅里叶变换节省了46%的运算操作。在特征提取过程中,考虑到人耳对不同频率的语音具有不同的感知能力,采用梅尔频率滤波器组提取梅尔频率倒谱系数。另外,论文还研究了影响语音识别性能的环境变化因素,并重点分析了抑制通道畸变的倒谱归正法。论文深入研究了语音端点检测算法和语音激活检测算法,并通过实验对该算法进行了阈值适应性改进,改进的联合语音激活检测以短时能量和短时过零率为语音检测特征的语音端点检测算法,具有良好抗噪音性能。实验证明,该算法计算简便、准确率高,能够较好地适用于语音识别系统中孤立句子的检测,避免了传统算法中仅适用于较短孤立词的缺点。  论文完成了预处理和特征提取算法的浮点C、定点C和嵌入式汇编代码实现及接口模块的ASIC设计。论文在算法的C代码实现中,设计了特殊函数的定点实现以平衡空间和时间的折衷。论文在汇编代码的实现中,采用嵌入内核的特点,减少指令代码、平衡指令存储、系数存储和执行效率。最后,论文将汇编生成的二进制代码及接口模块和DSP核的代码在Spartan3FPGA验证平台上进行验证,验证结果与汇编指令仿真结果一致。
其他文献
随着无线通信技术的迅猛发展及高速率宽频带通信市场需求的不断扩大,设计和实现具有高集成度、高性能、低功耗和低成本的毫米波单片集成电路迫在眉睫。近年来,随着深亚微米和纳
戏剧作品加工会是对原有的戏剧作品的加工和挖掘,以期能够实现戏剧作品层次的提升.随着经济不断地发展,人民对于精神文化的需求越来越广泛,对于艺术作品的要求也越来越高,戏
光系统Ⅰ(photosystemⅠ,PSⅠ)是位于光合生物(高等植物、藻类等)类囊体膜上催化光驱动的跨膜电子传递反应的色素-蛋白复合体,它利用光能催化囊腔侧的质体蓝素(或细胞色素c)的氧化
具有双向分化潜能和较强增殖能力的肝脏前体细胞(hepatic progenitor cells)正成为肝脏疾病治疗的一种值得期待的选择。而明确体外培养肝脏前体细胞的分化特性,建立优化的诱
摘要:应用LI-6400便携式红外气体分析仪,对北京市引进的4种乔木光合特性及生态效益进行研究,4种引进乔木分别是北美鹅掌楸(Liriodendron tulipifrea Linn.)、银槭(Acer sacch
王袆在《唐起居郎箴》中体现的“公议摄人主,史官持公议”,有对前人的继承,也有自己的见解,但并没有将史权置于君权之上.身处高度集权的明洪武年间仍能提出这种见解,实属不易
肠道吸收是人体获取胆固醇的重要途径,主要由多次跨膜蛋白Niemann-Pick C1Like1(NPC1L1)介导。NPC1L1蛋白在灵长类的肝脏和小肠中高表达,在啮齿类动物中特异性表达于小肠。NPC1
科技馆的科普宣传工作是社会科技文化建设的基础部分,也是科学技术的主要传播方式.科学技术的快速发展以及科技型社会的积极建设,使科技馆科普宣传工作变得更加重要.根据目前
公文写作是国家公务员的一项重要的基本技能,也是公务员初任在职和提职培训的必训科目.国家公务员要想具备高水平的公文写作能力,不是一蹴而就、短时间就能形成的,需要我们长
在20世纪40年代,蒙古学者巴·索特那木提出了“翻译文学”概念,针对翻译文学中存在的一些问题进行了全面性分析.而随后所出版的相关文学史著作也较为清楚地展现了当时蒙古文