智能音箱中自然语言语义理解算法的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hstiantian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能时代的到来,人工智能相关技术极速发展,语音交互已经成为人机交互最重要的方式之一。不论是互联网巨头还是传统的硬件厂商全部将目光瞄准了智能音箱,纷纷推出自己的智能音箱产品,试图将智能音箱作为语音入口,提供给用户众多内容服务,抢占智能家居的枢纽。在智能语音产品中,语义理解准确率是评价一个语音平台技术能力和一个语音产品好坏最重要的标准。因此,在智能音箱中最核心的环节是语义理解,而其中最重要的功能就是音乐。本文基于智能音箱的使用场景,对音乐领域的语义理解算法和优化方法进行了研究,主要开展的工作如下:首先,提出知识库与搜索结合的算法,实现音箱中音乐领域的语义理解。基于使用场景与要求,智能音箱中对音乐语义理解算法的要求可概述为:信息抽取和意图识别。为了解决信息抽取,提出基于知识库与搜索的思想解决音乐领域的信息抽取。这主要是源于音乐具有知识的概念,但内部并不具从属抽象关系,因此受领域内基于知识库的自然语言理解算法和基于语义的搜索算法启发,提出了知识库与搜索相结合。因智能音箱中query(指令)包含噪音信息,设计了 query预处理模块;为了解决音乐领域实体命名歧义问题,设计了排序步骤;为了解决意图判断,为语义理解算法设计了打分模块。基于以上的思想与方案,设计了由query预处理、搜索及排序、字段抽取和打分四个模块组成的音乐领域语义理解算法。其次,为了解决基于规则的排序和打分情况覆盖不全,随规则更加逻辑繁杂问题,提出运用机器学习算法代替规则,对语义理解算法进行优化。第一,提出用基于LambdaMART的音乐排序算法,优化排序子模块进而提升信息抽取的准确率即语义理解算法中属性准确率和属性值准确率。本文以AdaRank为对比,从不同角度对比两个排序学习算法,最终根据算法的结果和使用目的,证明选择LambdaMART的正确性。基于LambdaMART的音乐排序算法使语义理解算法的属性准确率提升至99.106%,属性值准确率提升至98.143%。第二,提出利用基于GBDT的音乐打分算法,优化打分子模块进而提高语义理解算法的意图识别准确率及意图召回率。通过对比选择不同特征及对特征值采用不同处理方式时GBDT模型的评价指标,选出最优GBDT模型。基于GBDT的打分算法使语义理解算法的意图准确率提升至99.19%,意图召回率提升至94.83%。
其他文献
由于高校扩招等因素的影响。职业学校生源不足、质量下降,给医学教育带来一定的困难,为了更好地探索医学教学改革,充分调动教与学2方面的积极性,不断创新发展,笔者于2001学年第二
<正>我们知道,语文教学历来都是创新的活跃领域,如何打破传统观念与传统的教学模式,推进人文教育的发展,是语文应用文教学改革所追求的.我们立足于教学实践活动,着眼于教学改
在大数据时代,关乎人民群众生命安全的消防宣传工作应顺势而为,充分借助当前大数据的丰厚资源,积极运用现代化的传播媒介和传播方式,改革传统消防宣传教育的内容和模式,拓展
一般而言 ,东南亚华文文学 ,经历了由华侨文学到华文文学的转变。但是 ,就东南亚华文文学所呈现的族群的身份意识而言 ,则经历了由华侨意识到华人意识再到华族意识 ,这样一个
文章旨在提出一个供企业管理人员系统思考企业财务管理的理论框架,着重从企业财务管理的基本理念、企业财务管理各职能活动之间的相互关系,以及各职能活动的关键环节等方面对
<正>牛病毒性腹泻还可以称之为牛黏膜,它的主要发病原因是牛的黏膜病毒在牛的体内大量的生长,破坏力相应的免疫机制。牛病毒性腹泻属于一种热性传染病。该病主要传染源是有病
<正>随着我国各项社会建设事业的迅猛发展和国力的强盛,重大活动、重要会议、重点建设工程、重大科研、重大改革、重要工作等"重字号"工程和活动(上海市将这六项重要活动简称
<正>位于广东省西北山区新兴县的广东温氏食品集团,以"十年百亿"的发展速度,向我们证明了基于分离与调用原理的"和谐生产方式"是切实可行的。
目的:利用学生评估与自我评估的比较,分析研究教学成效,以提高教学效果。方法:在2000级及2001级学生中随机抽检105份教学评估表,对前后两级学生评价做x^2检验,测定其差异性。以学生