家庭环境中语音情感识别的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:yanlei3352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学的发展和技术的进步,人工智能成为最热门的科技话题之一,越来越多的人工智能产品从理论研究走向实际应用。家庭生活的各个角落也都出现了人工智能的踪迹,从手机到电视,从音箱到冰箱,从扫地机器人到服务机器人,人们的生活发生了翻天覆地的变化。语音交互作为一种重要的人机交互形式,常被用到智能家居中。为了使智能家居产品实现更加自然、高效的人机交互,让其能够感受和分辨人的情感,家庭环境中语音情感识别的实现具有十分重要的意义。本文旨在通过对家庭环境下的语音情感识别进行研究,促进智能家居产品朝着更加人性化的方向发展。
  本文充分研究了语音情感识别的关键技术并分析了家庭环境中的语音特点,将使用传统机器学习算法与深度学习算法实现家庭环境下的语音情感识别,主要研究如下:
  首先,优化MMSE-LSA前端语音增强算法:使用噪声鲁棒的子带能熵比进行语音端点检测,更好地区分语音段和非语音段,建立非语音段的初始噪声模型;采用时间递归平均的噪声谱估计算法,创新性地采用后验信噪比的估计值计算说话人语音存在的概率并对不同频段的谐波使用不同的阈值。语音情感分类器选用的是机器学习中表现突出的支持向量机算法,实验证明优化后的MMSE-LSA算法整体上提高了语音质量和语音情感识别的准确率。
  然后,考虑到深度学习优秀的特征提取与分类能力,提出了适用于家庭环境语音情感识别的卷积神经网络模型,并探讨了不同数据增强策略对语音情感识别结果的影响。通过分析卷积神经网络在图像领域的应用,本文提出了三种不同 Attention 策略的卷积神经网络模型,结果表明时间维度的 Attention 提高了卷积神经网络在家庭环境下语音情感识别的准确率。
  最后,针对非特定人语音情感识别准确率不高的问题,本文引入了说话人识别模块,把非特定人语音情感识别转化为特定人语音情感识别并设计实现了家庭环境语音情感识别软件。该软件采用简单的C/S架构,使用python语言开发,为用户提供了简单、高效的图形交互界面。通过测试,本文实现的家庭环境语音情感识别软件具有良好的可交互性。
其他文献
近年来,以机器人为代表的智能制造掀起了世界范围内生产技术领域的风暴。物联网、大数据、云计算、人工智能等信息技术的重大突破,使得机器人的应用范围从工业制造向医疗健康、军事、农业等领域不断扩展。有着中国版“工业4.0”规划之称的《中国制造2025》将机器人产业列入重点战略,但是因为机器人产业涵盖了机械、电子、传感检测、计算机、生命科学等多个学科,对机器人设计提出了较高的要求。  目前,基于知识图谱的问
学位
随着计算机网络控制技术的发展,控制设计人员不仅要解决底层设备的实时控制问题,还要解决上层数据集成管理所带来的综合自动化问题。港口调度与管理是保证港口装卸作业按计划组织实施而进行的一系列部署、指挥、检查、监督、协调和平衡的总称,直接影响企业的经济效益。本文针对我国某内陆港口生产作业环节多,作业流程复杂,建立了散杂货码头和油港码头多资源协同调度优化问题的数学模型,对四种现代启发式求解算法进行了实验研究
随着通信、计算机和人工智能相关技术的发展,以及任务场景复杂度的加深,多智能体(Multi-agent)系统的编队包围控制已经成为了一个热门的研究领域。多智能体的编队包围控制要求智能体的状态保持一致,并且系统对特定感兴趣的目标形成一定的编队队形。目前,基于测量的编队包围控制存在以下问题:忽略了部分智能体不能够测量到与目标间的相对位置信息这种情况。而在该情况下,已有的编队包围控制器难以满足编队包围的要
学位
随着科技的迅猛发展和信息化时代的到来,图像描述生成任务在跨模态内容检索、人机交互、机器人导航等研究领域和电子商务、儿童教育等应用领域具有深远的研究意义和广阔的应用价值。传统的图像单句话描述生成模型由于单句话涵盖能力有限具有细节描述缺失和个体偏差的问题,密集字幕生成模型由于分立短语关联性弱具有物体间关系缺失和无法高效人机互动的问题,故本文将研究重点放在段落级的图像描述生成上,旨在解决上述问题,生成细
学位
近年来,生物特征识别技术已经受到越来越多的研究和关注,它可以为我们提供一种有效且可靠的个人身份识别方法。作为一种相对较新的生物特征,掌纹识别由于具有分辨力强、对用户友好、特征丰富等特点近来受到越来越多的国内外学者的关注。虽然二维掌纹识别具有易于采集、成本低的优点,但是二维掌纹图像容易受光照变化、角度翻转以及表面脏污的影响且可能被伪造的假手掌欺骗。三维掌纹识别技术在一定程度上克服了上述二维掌纹识别技
学位
闸机作为城市轨道交通线网运营管理中重要的交互设备之一,其通行控制的性能直接关系到乘客的出行体验和企业的票务收益。随着城市轨道交通迈入“网络化运营”时期,城市轨道交通承担着越来越繁重的城市客运工作。现有的基于红外传感器的闸机乘客通行行为识别算法已经难以满足复杂场景下的检测需求。如何高效地提取出更为完整的乘客通行时的姿态特征,从中检测并识别出乘客的通行行为,以避免客流量较大时的各种问题和风险,具有重要
学位