论文部分内容阅读
[摘 要]伴随“互联网+”的时代背景以及用户日渐成熟的理性购买认知,汽车或将走向智能、轻便、环保的运输本质,而人们的用车模式会趋向共享,用车出行会更便捷。人车之间将逐渐会实现自然语音交互,传统车企在新的浪潮中若未抓住变革机遇也许会退出市场,与之而来的是新兴汽车科技公司及新兴的汽车产业模式。新兴车企只有创造出崭新的车联网平台,才能符合互联网时代人们所需求的汽车产业生态。基于车联网平台下的汽车语音识别系统,是语音识别的一次革新,自然语音辨识将会成为车载场景下最好的人机交互方式,并可直接调用相关服务,免去多层菜单和触屏等复杂操作。车联网是未来汽车发展的风向标,本文将介绍车联网平台下自然语音辨识系统的研发过程。
[关键词]车联网;汽车语音识别;自然语音辨识;车辆人机交互
中图分类号:TM721 文献标识码:A 文章编号:1009-914X(2017)10-0297-01
1.引言
车联网技术就是互联网时代人们对汽车产业生态新需求下产生的新兴技术。国内车联网正在经由“屏幕+操作系统”的1.0版本向联网的2.0版本过渡,未来的方向主要是“账号系统+语音控制+云服务”的3.0版本。基于账号系统,可以实现围绕“人”在不同汽车硬件、消费电子硬件之间的服务延续性,实现基于“人”的个性化导航、娱乐和支付等服务。实现人与汽车之间无障碍的自然语言交互,减少驾驶人员通过手指触碰按钮或者对中控屏幕的触控来实现车辆功能的操作,保证汽车驾驶员能够将全部视觉集中在对车辆行驶外部环境的感知,避免因为操控按钮、中控触摸屏带来的视觉注意力的间断分散而导致意外情况的发生,保证了驾驶安全。车联网平台通过在车辆仪表台安装车载终端设备,实现对车辆所有工作情况和静、动态信息的采集、存储并发送。车联网系统一般具有实时实景功能,利用移动网络实现人车交互。其中传感器(包括摄像头、雷达、速度等传感器)所采集的信息是从不同机理和角度采集,比较片面孤立。当遇到复杂路况及突发工况时,自然语音辨识的信息采集交互介入,能够更加精准判别车辆行驶中的真实工况。同时采用旋律识别技术对旋律节奏及特征的识别,将音乐做旋律分析和归类,基于音乐旋律和人类起居生理特征提供音乐服务,以驾驶环境下的汽车驾驶员为例,可以提供符合人体工程学的人性化音乐服务,营造舒适的音乐氛围,降低汽车驾驶员的驾驶疲劳。语音识别技术对特定人的声纹提取,基于声纹的身份验证及语音指令验证,探索完整的声纹鉴定商用解决方案。
2.车联网平台下语音识别系统的研发
车联网平台下语音识别系统的研发的主要内容有:分析汉语自然语音的特点,提取自然语音识别目标的关键特征;建立相关特征识别算法;采集不同地区人员的自然语音数据,并使用特征识别算法,提取特征,并对特征数据进行相应分类,运用人工智能算法进行训练识别,确定特征值;对采集语音数据与特征值进行比对分析,矫正特征值;在特征值基础上进行语音谱分析,结合时域与频域特点从总体角度分析。针对车内不同工况,采集背景噪声并进行分析,得到语音及噪声频谱特征;在语音谱识别基础上,建立降噪模型;设计一套典型的车内操控指令集,对这些指令进行信号采集与分析;针对在汽车内采集到的语音指令,设计噪声抑制模块来滤除噪声;基于车联网平台,建立车辆自然语音识别介入判别规则;开发硬件系统和软件系统;在车联网平台,进行实车测试。由于语音信号是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅立叶变换不能用来直接表示语音信号,如何建立短时变换算法对语音信号的频谱进行分析,建立相应的频谱“短时谱”,语音辨识训练指的是按照一定的准则,从大量已知的语音样本中提取出能表示该模式特征的模型參数,在语音识别的流程中,即为从大量的相似的语音信号中提取出它们共同的特征以得到一个声学模型(参考模板)。而模式匹配则指的是根据一定的准则,使测试信号与已知声学模型中的某一模型相匹配。当前的匹配算法没有考虑汽车行驶中噪声影响情况下,针对汽车内工况辨识效果不良的问题。针对此问题,建立语音谱特征分析方法,降低噪声对语音辨识产生的干扰。建立声纹识别技术,并对特定人的声纹进行提取,基于声纹的身份验证及语音指令验证,制定完整的声纹鉴定商用解决方案。
3.车载语音识别系统
车载语音识别的本质,就是一种模式识别理论。动态时间归正、隐性马尔科夫链模型等都是如此。总之,一个完整的车载语音识别系统包含以下三个部分:
1.前端处理和特征提取:通过对信号适当的放大和增益控制,对其滤波和消除干扰,再进行数字化,然后从中提取特征序列,用反映语音特点的一些参数来表征信号特性;
2.识别算法:对语音信号提取了特征参数,以此来表征信号的特性,并且生成参考模式库。在对待测信号进行识别时同样先对其进行特征参数提取,然后逐一与参考模式库中的各模板进行匹配求取失真度,据此判断最佳的识别结果;
3.语义理解:完成识别判断后,将识别结果以某种指令或者表现形式输出,让计算机据此执行相应的操作,这就是识别结果的输出,即语义理解。
车联网平台下语音识别系统的研发解决方案:系统研发旨在解决自然语言在汽车内噪音工况下的语音辨识。掌握语音辨识机理理论及算法;明确各算法优缺点及适用对象,针对汽车内噪声存在的特殊环境下,构建自然语音谱辨识方法;采集不同地区语音数据,利用自然语音谱辨识方法进行语音辨识训练;提取出表征信号的特性,并且生成语音辨识参考模式库;搭建语音辨识硬件平台;进行硬件平台测试并修正优化相应算法,具体流程详见图1。
参考文献
[1] 施卫东.浅谈车联网技术的应用[J].计算机光盘软件与应用,2015,(01):39-40
[2] 潘梁生.列车车载语音识别系统的设计与实现[D].北京:北京交通大学,2016.
[3] 刘筠,卢超.新型车载语音识别系统中的一种关键技术[J].微处理机,2008,(04):177-180
作者简介
姓名:张山,专业:车辆工程,出生日期:1996年7月,研究方向:车辆工程,车载语音识别。
[关键词]车联网;汽车语音识别;自然语音辨识;车辆人机交互
中图分类号:TM721 文献标识码:A 文章编号:1009-914X(2017)10-0297-01
1.引言
车联网技术就是互联网时代人们对汽车产业生态新需求下产生的新兴技术。国内车联网正在经由“屏幕+操作系统”的1.0版本向联网的2.0版本过渡,未来的方向主要是“账号系统+语音控制+云服务”的3.0版本。基于账号系统,可以实现围绕“人”在不同汽车硬件、消费电子硬件之间的服务延续性,实现基于“人”的个性化导航、娱乐和支付等服务。实现人与汽车之间无障碍的自然语言交互,减少驾驶人员通过手指触碰按钮或者对中控屏幕的触控来实现车辆功能的操作,保证汽车驾驶员能够将全部视觉集中在对车辆行驶外部环境的感知,避免因为操控按钮、中控触摸屏带来的视觉注意力的间断分散而导致意外情况的发生,保证了驾驶安全。车联网平台通过在车辆仪表台安装车载终端设备,实现对车辆所有工作情况和静、动态信息的采集、存储并发送。车联网系统一般具有实时实景功能,利用移动网络实现人车交互。其中传感器(包括摄像头、雷达、速度等传感器)所采集的信息是从不同机理和角度采集,比较片面孤立。当遇到复杂路况及突发工况时,自然语音辨识的信息采集交互介入,能够更加精准判别车辆行驶中的真实工况。同时采用旋律识别技术对旋律节奏及特征的识别,将音乐做旋律分析和归类,基于音乐旋律和人类起居生理特征提供音乐服务,以驾驶环境下的汽车驾驶员为例,可以提供符合人体工程学的人性化音乐服务,营造舒适的音乐氛围,降低汽车驾驶员的驾驶疲劳。语音识别技术对特定人的声纹提取,基于声纹的身份验证及语音指令验证,探索完整的声纹鉴定商用解决方案。
2.车联网平台下语音识别系统的研发
车联网平台下语音识别系统的研发的主要内容有:分析汉语自然语音的特点,提取自然语音识别目标的关键特征;建立相关特征识别算法;采集不同地区人员的自然语音数据,并使用特征识别算法,提取特征,并对特征数据进行相应分类,运用人工智能算法进行训练识别,确定特征值;对采集语音数据与特征值进行比对分析,矫正特征值;在特征值基础上进行语音谱分析,结合时域与频域特点从总体角度分析。针对车内不同工况,采集背景噪声并进行分析,得到语音及噪声频谱特征;在语音谱识别基础上,建立降噪模型;设计一套典型的车内操控指令集,对这些指令进行信号采集与分析;针对在汽车内采集到的语音指令,设计噪声抑制模块来滤除噪声;基于车联网平台,建立车辆自然语音识别介入判别规则;开发硬件系统和软件系统;在车联网平台,进行实车测试。由于语音信号是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅立叶变换不能用来直接表示语音信号,如何建立短时变换算法对语音信号的频谱进行分析,建立相应的频谱“短时谱”,语音辨识训练指的是按照一定的准则,从大量已知的语音样本中提取出能表示该模式特征的模型參数,在语音识别的流程中,即为从大量的相似的语音信号中提取出它们共同的特征以得到一个声学模型(参考模板)。而模式匹配则指的是根据一定的准则,使测试信号与已知声学模型中的某一模型相匹配。当前的匹配算法没有考虑汽车行驶中噪声影响情况下,针对汽车内工况辨识效果不良的问题。针对此问题,建立语音谱特征分析方法,降低噪声对语音辨识产生的干扰。建立声纹识别技术,并对特定人的声纹进行提取,基于声纹的身份验证及语音指令验证,制定完整的声纹鉴定商用解决方案。
3.车载语音识别系统
车载语音识别的本质,就是一种模式识别理论。动态时间归正、隐性马尔科夫链模型等都是如此。总之,一个完整的车载语音识别系统包含以下三个部分:
1.前端处理和特征提取:通过对信号适当的放大和增益控制,对其滤波和消除干扰,再进行数字化,然后从中提取特征序列,用反映语音特点的一些参数来表征信号特性;
2.识别算法:对语音信号提取了特征参数,以此来表征信号的特性,并且生成参考模式库。在对待测信号进行识别时同样先对其进行特征参数提取,然后逐一与参考模式库中的各模板进行匹配求取失真度,据此判断最佳的识别结果;
3.语义理解:完成识别判断后,将识别结果以某种指令或者表现形式输出,让计算机据此执行相应的操作,这就是识别结果的输出,即语义理解。
车联网平台下语音识别系统的研发解决方案:系统研发旨在解决自然语言在汽车内噪音工况下的语音辨识。掌握语音辨识机理理论及算法;明确各算法优缺点及适用对象,针对汽车内噪声存在的特殊环境下,构建自然语音谱辨识方法;采集不同地区语音数据,利用自然语音谱辨识方法进行语音辨识训练;提取出表征信号的特性,并且生成语音辨识参考模式库;搭建语音辨识硬件平台;进行硬件平台测试并修正优化相应算法,具体流程详见图1。
参考文献
[1] 施卫东.浅谈车联网技术的应用[J].计算机光盘软件与应用,2015,(01):39-40
[2] 潘梁生.列车车载语音识别系统的设计与实现[D].北京:北京交通大学,2016.
[3] 刘筠,卢超.新型车载语音识别系统中的一种关键技术[J].微处理机,2008,(04):177-180
作者简介
姓名:张山,专业:车辆工程,出生日期:1996年7月,研究方向:车辆工程,车载语音识别。