论文部分内容阅读
随着人口老龄化问题的日益严重,越来越多的独居老人需要照顾,护老、助老的服务机器人对人类生活的影响越来越大。同时随着人们健康意识不断提高,饮食健康逐渐成为人们日益关心的问题。科学合理的饮食不仅有利于保持身体健康,而且可以降低人们患癌症、糖尿病、心脏病以及其他与年龄有关疾病的风险。虽然现有服务机器人的应用性、智能性得到了很大改善,可以通过定期的对话问答或穿戴设备为用户建立健康档案,但无法通过服务机器人的视觉或听觉系统自动收集饮食信息,忽略了饮食对人体健康的重大影响。为了进一步提高服务机器人在健康管理方面的能力,本文从与人们生活息息相关,且对人体健康影响较大的饮食出发,利用服务机器人的听觉系统,主动监听用户的日常聊天对话,自主获取用户的饮食信息,为用户调整其不良饮食结构提供依据,同时也为医生制定适当的治疗处方、深入了解疾病与饮食之间的关系提供参考。本文的主要研究内容及创新点如下:1)设计了针对不同表达模式的语音数据处理方法,用以获取不同说话人的身份与语音表达内容。首先对本文中所用到的声纹识别、语音分割聚类和语音识别方法进行了概述;然后基于不同表达模式的特点,设计了针对单人表达和多人对话的语音数据处理框架;依据服务机器人平台运算性能有限的特点,选取了基于梅尔频率倒谱系数和矢量量化算法的声纹识别方法进行了身份识别,同时设计了基于卷积神经网络的声纹识别方法;最后提出了基于序列关系和身份特征的语音片段聚类方法,借助训练好的声纹识别模型来代替相似度度量方法,对进行语音片段聚类。2)提出了基于服务机器人听觉的饮食构成自主感知算法。首先基于国家食品分类办法和日常表达行为模式,以人工收集与网络爬虫技术的方式构建了饮食信息词库;然后以中文分词、词性和依存句法作为特征,提出了基于一阶谓词逻辑理论的单人表达与多人对话的饮食获取推理定义,根据中文语言表达模式和对话中参与的人数,分别设计出了基于单人表达与多人对话的饮食构成感知推理算法。3)对本文所提算法进行了实现、集成,收集了训练和测试数据,并进行了性能测试与结果分析。搭建了服务机器人平台,使用Python与C编程语言对本文算法进行了实现。首先测试得出了最优声纹识别效果的梅尔频率倒谱系数;然后针对本研究所出现的歧义性与欺骗性表达导致结果异常的情况,提出了改进的评价指标;最后对测试结果进行了分析与对比,测试结果表明,基于服务机器人听觉的饮食构成自主感知系统能够实现在家庭环境下,对不同表达模式饮食信息的准确获取,有良好的识别效果和鲁棒性。