声学建模相关论文
目前说话人、环境及发音多样性仍是语音识别声学建模中需解决的主要难题,为了克服这些不利因素的影响,本文将经过三层结构优化后的......
语音情感识别是自动语音识别的重要研究方向,提取最能表征语音情感的特征并构建具有较强鲁棒性和泛化性的声学模型是语音情感识别......
针对阶梯圆柱形耦合声场建模问题,提出基于特征正交-里兹能量原理的声学建模方法.该方法利用二维特征正交多项式和周向傅里叶级数......
说话人的地方口音、非母语口音是汉语普通话语音识别系统实现推广应用面临的具有挑战性的问题。基于标准普通话的语音识别系统在识......
钢质海船的居住舱室噪声不仅会降低居住人员的舒适度,还会损害居住人员的身体健康.本文通过分析舱室噪声的来源,从船舶舱室噪声的......
声学建模是语音识别领域中的关键问题之一。本文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究。主要针对以......
随着全球化趋势和国际互联网的发展,人们更加迫切的希望可以突破语言的障碍进行交流,因而对于语种识别技术的需求也与日俱增。不仅......
基于语音的人机交互方式,因便捷高效而越来越受到人们的青睐。语音识别作为其中最关键的技术之一,长期以来都吸引了大量的科研人员。......
深度学习的蓬勃发展极大地推动了语音合成声学建模技术的革新。本文以深度学习技术为理论基础,对语音合成声学建模技术进行了深入的......
本文针对电话信道多语言环境下的语音识别和语音搜索的技术难题,进行了广泛而深入的研究,主要内容包括:
首先,在跨语种通用声......
电话是最普及的话音通信工具,是各种先进语音技术最大的潜在应用领域。语音识别是基于电话平台的语音应用的一项核心技术。大词汇量......
随着深度神经网络的兴起,数据、算法和计算能力已成为决定识别系统性能的关键因素。英语、汉语普通话等语言得益于其丰富的数据资......
分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响......
以宁波市轨道交通1号线高架段声屏障为例,基于Cadna/A噪声预测软件进行声学建模,对比分析双侧直立式、近似全封闭式声屏障降噪效果......
提出了一种共享空间旋转变换的声学建模方法。该方法结合状态空间旋转变换和方差部分共享的优点,克服了空间旋转变换方法由于每个......
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框......
随着数字化、网络化和信息化时代的到来,人机交互平台越来越趋向简便化,如企业采用电子商务和呼叫中心来服务客户和加速商业进程。为......
经过几十年的研究,语音识别技术取得显著进步,在无噪声、朗读发音等特定条件下已经走向实用。然而,在面临低数据资源、噪声干扰、说话......
语音作为语言的声音表现形式,是人类交流信息最自然、最有效、最方便的手段。人类的语音中不仅包含了语言学信息,同时也包含了人们......
该论文在汉语说话人识别的理论与实际应用方面作了一定的研究,现在语音方面的研究主要集中在语音识别、合成、压缩以及说话人识别......
“可以交谈的计算机”一直是语音技术、人工智能等相关领域科研工作者不懈追求的目标。HMM语音合成系统在可懂度方面已经达到了可......
该文的研究工作可分为两大部分.第一部分是论文研究的基础部分,主要分析了口语语音对识别技术提出的挑战,及该论文研究的背景和主......
为了提高噪声环境下语音识别系统的鲁棒性,本文提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指......
正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,......
深度学习是模式识别和机器学习领域最新的研究成果,它以强大的建模和表征能力在图像和语音处理等领域取得了很好的应用。将深度学......
根据领域术语的音节关联特点,提出一种基于术语音节关联特性的领域术语声学模型建模方法。该方法首先根据领域术语字间发音的特点,......
本文从直接合并汉英双语的 phoneset入手 ,对三种不同的汉英双语混合声学建模方法进行了研究。这三种方法分别是 :(1)直接合并二者......
基于三音子连续语音识别的棒性估计.为了解决这个问题,有两个主要的上下文相关的聚类算法被提出,它们是合并(Agglomerative Cluste......
为了结合泡沫金属兼有的高吸声和高热传导两种特性以进一步提高其吸声性能,回顾了泡沫金属材料的应用和声学建模;通过对泡沫金属和用......
针对汉语语音识别中协同发音现象引起的语音信号的易变性,提出一种基于音节的声学建模方法。首先建立基于音节的声学模型以解决音......
语音识别是实现人机交互,促进人工智能发展的关键技术。在过去的几十年里,国内外的许多专家学者在这一领域投入了大量精力,并取得......
语音合成解决的主要问题就是如何将文字信息转化为可听的声音信息,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,......
语音作为人与人之间最便捷的交流方式,关于其识别的研究一直是比较热门的话题,尤其是在深度学习流行起来之后,借助神经网络进行语......
探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通......
A review of mid-frequency vibro-acoustic modelling for high- speed train extruded aluminium panels a
现在的纸考察包括的渗出的铝火车地板结构的 vibro 声学的建模它中间频率的建模技术上的工业应用,以及最近的开发最先进一般来说。......
<正>日前,语文出版社召开了"中国汉语方言数字化工程"子项目"方言掌上通"中期成果验收会。"方言掌上通"预计打造一款面向手机等移......
近二十年来,统计参数语音合成方法发展迅速,声学建模与声码器是其中两个关键技术。声码器用于从语音波形中提取基频、频谱等声学特......
为解决煤岩界面识别问题,采用声学探测法,依据声波在水煤、煤岩界面反射、折射时,在界面处满足声压连续和质点速度连续的物理性质,......
随着深度学习的兴起,作为语音识别系统的核心部分,声学模型经历了从基于高斯混合模型声学建模到基于神经网络的声学建模的发展历程......
"地铁+上盖物业"模式现已在很多城市中应用,其中地铁车辆段的噪声问题急需处理.文章以某地铁车辆段冷却塔为例,阐述了如何收集用于......
为了结合泡沫金属兼有的高吸声和高热传导两种特性以进一步提高其吸声性能,回顾了泡沫金属材料的应用和声学建模;通过对泡沫金属和......
随着深度学习的发展,深度神经网络(Deep Neural Network,DNN)与循环神经网络(Recurrent Neural Networks,RNN)已被成功应用于英文......
建立基于BEM/FEM联合求解方法的柴油机整机结构声辐射仿真流程;采用与传统算法的对比,结构动态精细模型技术,柴油机整机组合结构摩......
语音识别是模式识别领域中重要的研究分支,其目的是将人类语音信息转换为文本信息。在汉语和英语语音识别中,相比于传统的高斯混合......