论文部分内容阅读
随着智能时代的到来,人工智能相关技术极速发展,语音交互已经成为人机交互最重要的方式之一。不论是互联网巨头还是传统的硬件厂商全部将目光瞄准了智能音箱,纷纷推出自己的智能音箱产品,试图将智能音箱作为语音入口,提供给用户众多内容服务,抢占智能家居的枢纽。在智能语音产品中,语义理解准确率是评价一个语音平台技术能力和一个语音产品好坏最重要的标准。因此,在智能音箱中最核心的环节是语义理解,而其中最重要的功能就是音乐。本文基于智能音箱的使用场景,对音乐领域的语义理解算法和优化方法进行了研究,主要开展的工作如下:首先,提出知识库与搜索结合的算法,实现音箱中音乐领域的语义理解。基于使用场景与要求,智能音箱中对音乐语义理解算法的要求可概述为:信息抽取和意图识别。为了解决信息抽取,提出基于知识库与搜索的思想解决音乐领域的信息抽取。这主要是源于音乐具有知识的概念,但内部并不具从属抽象关系,因此受领域内基于知识库的自然语言理解算法和基于语义的搜索算法启发,提出了知识库与搜索相结合。因智能音箱中query(指令)包含噪音信息,设计了 query预处理模块;为了解决音乐领域实体命名歧义问题,设计了排序步骤;为了解决意图判断,为语义理解算法设计了打分模块。基于以上的思想与方案,设计了由query预处理、搜索及排序、字段抽取和打分四个模块组成的音乐领域语义理解算法。其次,为了解决基于规则的排序和打分情况覆盖不全,随规则更加逻辑繁杂问题,提出运用机器学习算法代替规则,对语义理解算法进行优化。第一,提出用基于LambdaMART的音乐排序算法,优化排序子模块进而提升信息抽取的准确率即语义理解算法中属性准确率和属性值准确率。本文以AdaRank为对比,从不同角度对比两个排序学习算法,最终根据算法的结果和使用目的,证明选择LambdaMART的正确性。基于LambdaMART的音乐排序算法使语义理解算法的属性准确率提升至99.106%,属性值准确率提升至98.143%。第二,提出利用基于GBDT的音乐打分算法,优化打分子模块进而提高语义理解算法的意图识别准确率及意图召回率。通过对比选择不同特征及对特征值采用不同处理方式时GBDT模型的评价指标,选出最优GBDT模型。基于GBDT的打分算法使语义理解算法的意图准确率提升至99.19%,意图召回率提升至94.83%。