论文部分内容阅读
摘 要:本文基于LD3320语音识别模块[1]和STM32ZET6单片机,设计制作了一个语音控制的电子阅读移动器。通过语音识别技术,对电子移动阅读器的机械臂进行控制。试验表明,该语音控制机械臂运作良好,能实现基于坐标的定点移动等基本性能,识别率高,具备一定的实用价值。[2-7]
关键词:机械臂控制;语音控制LD3320;定点移动函数
0引言
随着机器化和信息化的水平逐渐提高,为了更好地利用语音控制相比其他的人机交互的方式更加方便、实用的特点,也为了减少长时间阅读电子设备对眼睛的伤害,从而将机械臂的语音控制应用更加深入我们的生活,通过对人们的生活习惯语句进行分析和编程,采用LD3320语音识别、单片机控制,设计出一款语音控制的用来解放双手,保护眼睛的电子移动阅读器。
1系统总体设计
设计的电子阅读器由语音识别电路和五自由度机械臂组成,控制电路由两大部分组成,分别为:机械臂控制电路和语音识别电路。机械臂控制电路由单片机、机械臂、步进电机组成,可以实现对机械臂动作命令的执行进行控制;语音识别电路包括语音识别模块和单片机子电路模块,可以实现对语音命令识别、控制信号判别输出、和机械臂控制命令发送等操作;
系统框架总体设计如图1所示
2 硬件电路设计
2.1 语音识别电路
语音识别电路实现的主要目标, 是用来判断语音的输入情况。和与输出相对应的控制命令字符串到单片机中。为了使硬件设计的过程更加简化,设计语音识别部分所选用的是LD3320集成模块,该芯片集成了语音识别处理器、高精度的A/D、D/A转换器,麦克风的借接口、语音输出接口等。而且并不需要任何外接辅助芯片如FLASH、RAM等,并且可以自定义开始的状态、关键词列表及其对应的输出状况。
语音识别电路的电路图如图2所示。
2.2 机械臂执行控制电路
机械臂执行控制电路采用的五自由度机械臂的元件都是目前市场上所常见的,五自由度机械臂能实现的功能是对五路的步进电机进行控制,机械手臂的弯曲角度与输入脉宽信号有关,如要控制机械手臂的角度只需要改变它输入的脉宽信号即可。单片机收到语音识别电路输出的信号后可以对脉宽信号进行控制,从而實现机械手臂的定角度弯曲。
3 系统软件设计
3.1 系统软件设计的总要求
人们日常生活关于习惯性的语言命令大致可以分为实时性和计划性。所以对于系统软件的设计方法也要包含人们关于这两个方面的要求。才有多模式按键切换的方法可以满足人们对语音控制机械臂种种要求
3.2 实时性及计划性的实现分析
实时性,从一个方面分析,就是对人们发出的语音信号立即做出反应,注重的是短时间内的高互动性能。解决实时性需要机械臂对人们发出的语音命令立刻执行,采用直接控制模式可以使机械臂及时响应人们的命令控制,可以实现“一词一动”。计划性,更注重于未来的计划,和计划各部分因素的全面性。对于机械臂的动作而言,可以总结成:机械臂动作,距离,终端的停止坐标等多个方面的内容,需要具体情况具体分析各个部分协同解决。由于上述特征,所以直接控制并不符合计划性的的性质,因而需要进行相应的发送条件设置,对于人们在日常生活中的习惯性语言设计了两种发送条件设置。按键发送和口令发送模式,可以实现“一句多动,条件行动”
3.3 机械臂控制的软件设计
机械臂控制的部分一共由五个步进电机组成,有两类。第一类为旋转底座控制电机,由一号步进电机电机组成,械臂的动作方位是它来控制的,可旋转角度为270°,以机械臂运动方位作为参考,可以实现上下两个方向各自旋转135°;第二类为机械臂关节电机,由二号步进电机组成,用来实现机械臂拟人化动作,使机械臂可以像人类手臂一样左右向前向后弯曲摆动。根据上述情况,可以使用其余步进电机的组合动作改变方位,远近,高低来确定机械臂终端位置,坐标的设置对于机械臂终端的定位和摆放方式具有重要的意义。有两种方法实现坐标的设定。第一种是让控制机械臂的单片机把机械臂各个部分的步进电机协同工作,使终端到达坐标点。当收到指令的字符串时,则由控制芯片对坐标计算得到相应的值,然后匹配相应的步进电机信号组合实现坐标的设定;第二种方法是收到在机械臂控制单片机收到字符串指令后仅对一个步进电机进行脉宽输出,由语音识别部分进行坐标的计算和指令的选择。第一种方法会使程序段过长、响应延迟长等的问题,所以采用后者的坐标设置,由语音识别部分的控制芯片进行计算输出更加便捷。
3.4 语音识别部分软件设计
语音识别部分主控程序主要实现的功能有五种:分别为信号采集功能、坐标设定功能、命令选择功能等3个模块。程序执行过程首先要进行初始化的设定,在单片机接通电源之后设置串口,设置标志位的模式MODE=1(只有模式标志位改变时才可以实现模式的切换,用中断功能来实现),机械臂控制命令数组等关键的变量。初始化成功之后进入各控制模式的程序段后,对于模式一(直接发送模式)的程序执行过程为:等待信号激活标志位的高电平信号,一旦标志位置高,则进行对P1口的电平信号进行扫描,把得到的数据当作识别码对控制命令进行选择。若在此过程中收到了坐标相关的语音指令,则立刻执行坐标设定函数COORDINATE SETTING(),并与其匹配的步进电机信号进行组合,保存到步进电机控制数组中,便于实现对机械臂的“一词一动”。模式二(口令发送模式)与模式三(按键发送模式)成功初始化之后的流程与模式一基本一致,只是执行数据发送的条件判断不同,模式二为语音命令的“发送”而模式三为按键发送,发送判断为NO时需返回等待信号激活标志位的步骤,若发送条件为YES则执行发送指令。此时,坐标计算函数的计算过程须和数组的坐标位协同进行,原理和模式一大致相同。
语音识别部分程序流程图如图3所示。
4结束语
实验结果表明,设计的语音控制机械臂可以成功识别语音信号,并实现机械臂的定点移动等基本功能,语音识别命令的平均成功率达到90%以上。模式一可以在固定时间内对语音命令进行响应,与机械臂的互动性较强;模式二、三种,输入预定好的语音命令之后,做到了只有发送条件成立后,再把相对应的控制指令相继的发送给机械臂,从而执行相对应的操作。综上所述,设计的语音控制机械臂符合预期对语音命令的实时性以及计划性的要求,工作稳定,性能良好。就结果而言,设计依旧存在两个方面的问题:一方面是语音识别效率不高,导致人机交流不够充分流畅,还并不能实现真正意义上的人机交互的最终目标;在另一方面,机械臂的操作流畅感稍嫌不足,语音识别效率和定点移动准确度仍有很大的改进空间,这些不足之处将在往后的工作中加以改进和实现。
感谢国家对大学生创新训练项目的支持。
参考文献:
[1] 车刘鑫,李崇斌,钟卓霖,黄明惠,刘勇,姚嘉金,陈逸彬.语音控制机器人的设计[J].电子制作,2018(23):3-5+100.
[2] 李晓朋.语言识别技术的应用[J].电子技术与软件工程 .2016(23):156
[3] 祁艳飞,王茂森,戴劲松.语音控制在智能机器人中的应用 [J]. 仪表技术 .2015(7):45-49.
[4] 宋柏佑.机械臂语音控制系统研究 [D]. 西安科技大学 .2017.
[5] 唐米杰,李新国.基于语音识别与单片机控制的智能玩具设 计与实现 [J]. 计算技术与自动化 .2013,32(4):37-40.
[6] 陈松,王萍,李辉.基于单片机的语音识别机器人的设计 [J]. 才智 .2010(20):306-307.
[7] 钟晨帆.基于 LD3320 芯片的语音识别系统设计与开发 [D]. 南京大学 .2015.
作者简介:
杨帆,男(1999,10)辽宁抚顺人,本科,上海工程技术大学,电子电气工程学院,自动化,大三,研究方向:自动化.
基金项目:市级大学生创新训练项目编号cs1902007.
关键词:机械臂控制;语音控制LD3320;定点移动函数
0引言
随着机器化和信息化的水平逐渐提高,为了更好地利用语音控制相比其他的人机交互的方式更加方便、实用的特点,也为了减少长时间阅读电子设备对眼睛的伤害,从而将机械臂的语音控制应用更加深入我们的生活,通过对人们的生活习惯语句进行分析和编程,采用LD3320语音识别、单片机控制,设计出一款语音控制的用来解放双手,保护眼睛的电子移动阅读器。
1系统总体设计
设计的电子阅读器由语音识别电路和五自由度机械臂组成,控制电路由两大部分组成,分别为:机械臂控制电路和语音识别电路。机械臂控制电路由单片机、机械臂、步进电机组成,可以实现对机械臂动作命令的执行进行控制;语音识别电路包括语音识别模块和单片机子电路模块,可以实现对语音命令识别、控制信号判别输出、和机械臂控制命令发送等操作;
系统框架总体设计如图1所示
2 硬件电路设计
2.1 语音识别电路
语音识别电路实现的主要目标, 是用来判断语音的输入情况。和与输出相对应的控制命令字符串到单片机中。为了使硬件设计的过程更加简化,设计语音识别部分所选用的是LD3320集成模块,该芯片集成了语音识别处理器、高精度的A/D、D/A转换器,麦克风的借接口、语音输出接口等。而且并不需要任何外接辅助芯片如FLASH、RAM等,并且可以自定义开始的状态、关键词列表及其对应的输出状况。
语音识别电路的电路图如图2所示。
2.2 机械臂执行控制电路
机械臂执行控制电路采用的五自由度机械臂的元件都是目前市场上所常见的,五自由度机械臂能实现的功能是对五路的步进电机进行控制,机械手臂的弯曲角度与输入脉宽信号有关,如要控制机械手臂的角度只需要改变它输入的脉宽信号即可。单片机收到语音识别电路输出的信号后可以对脉宽信号进行控制,从而實现机械手臂的定角度弯曲。
3 系统软件设计
3.1 系统软件设计的总要求
人们日常生活关于习惯性的语言命令大致可以分为实时性和计划性。所以对于系统软件的设计方法也要包含人们关于这两个方面的要求。才有多模式按键切换的方法可以满足人们对语音控制机械臂种种要求
3.2 实时性及计划性的实现分析
实时性,从一个方面分析,就是对人们发出的语音信号立即做出反应,注重的是短时间内的高互动性能。解决实时性需要机械臂对人们发出的语音命令立刻执行,采用直接控制模式可以使机械臂及时响应人们的命令控制,可以实现“一词一动”。计划性,更注重于未来的计划,和计划各部分因素的全面性。对于机械臂的动作而言,可以总结成:机械臂动作,距离,终端的停止坐标等多个方面的内容,需要具体情况具体分析各个部分协同解决。由于上述特征,所以直接控制并不符合计划性的的性质,因而需要进行相应的发送条件设置,对于人们在日常生活中的习惯性语言设计了两种发送条件设置。按键发送和口令发送模式,可以实现“一句多动,条件行动”
3.3 机械臂控制的软件设计
机械臂控制的部分一共由五个步进电机组成,有两类。第一类为旋转底座控制电机,由一号步进电机电机组成,械臂的动作方位是它来控制的,可旋转角度为270°,以机械臂运动方位作为参考,可以实现上下两个方向各自旋转135°;第二类为机械臂关节电机,由二号步进电机组成,用来实现机械臂拟人化动作,使机械臂可以像人类手臂一样左右向前向后弯曲摆动。根据上述情况,可以使用其余步进电机的组合动作改变方位,远近,高低来确定机械臂终端位置,坐标的设置对于机械臂终端的定位和摆放方式具有重要的意义。有两种方法实现坐标的设定。第一种是让控制机械臂的单片机把机械臂各个部分的步进电机协同工作,使终端到达坐标点。当收到指令的字符串时,则由控制芯片对坐标计算得到相应的值,然后匹配相应的步进电机信号组合实现坐标的设定;第二种方法是收到在机械臂控制单片机收到字符串指令后仅对一个步进电机进行脉宽输出,由语音识别部分进行坐标的计算和指令的选择。第一种方法会使程序段过长、响应延迟长等的问题,所以采用后者的坐标设置,由语音识别部分的控制芯片进行计算输出更加便捷。
3.4 语音识别部分软件设计
语音识别部分主控程序主要实现的功能有五种:分别为信号采集功能、坐标设定功能、命令选择功能等3个模块。程序执行过程首先要进行初始化的设定,在单片机接通电源之后设置串口,设置标志位的模式MODE=1(只有模式标志位改变时才可以实现模式的切换,用中断功能来实现),机械臂控制命令数组等关键的变量。初始化成功之后进入各控制模式的程序段后,对于模式一(直接发送模式)的程序执行过程为:等待信号激活标志位的高电平信号,一旦标志位置高,则进行对P1口的电平信号进行扫描,把得到的数据当作识别码对控制命令进行选择。若在此过程中收到了坐标相关的语音指令,则立刻执行坐标设定函数COORDINATE SETTING(),并与其匹配的步进电机信号进行组合,保存到步进电机控制数组中,便于实现对机械臂的“一词一动”。模式二(口令发送模式)与模式三(按键发送模式)成功初始化之后的流程与模式一基本一致,只是执行数据发送的条件判断不同,模式二为语音命令的“发送”而模式三为按键发送,发送判断为NO时需返回等待信号激活标志位的步骤,若发送条件为YES则执行发送指令。此时,坐标计算函数的计算过程须和数组的坐标位协同进行,原理和模式一大致相同。
语音识别部分程序流程图如图3所示。
4结束语
实验结果表明,设计的语音控制机械臂可以成功识别语音信号,并实现机械臂的定点移动等基本功能,语音识别命令的平均成功率达到90%以上。模式一可以在固定时间内对语音命令进行响应,与机械臂的互动性较强;模式二、三种,输入预定好的语音命令之后,做到了只有发送条件成立后,再把相对应的控制指令相继的发送给机械臂,从而执行相对应的操作。综上所述,设计的语音控制机械臂符合预期对语音命令的实时性以及计划性的要求,工作稳定,性能良好。就结果而言,设计依旧存在两个方面的问题:一方面是语音识别效率不高,导致人机交流不够充分流畅,还并不能实现真正意义上的人机交互的最终目标;在另一方面,机械臂的操作流畅感稍嫌不足,语音识别效率和定点移动准确度仍有很大的改进空间,这些不足之处将在往后的工作中加以改进和实现。
感谢国家对大学生创新训练项目的支持。
参考文献:
[1] 车刘鑫,李崇斌,钟卓霖,黄明惠,刘勇,姚嘉金,陈逸彬.语音控制机器人的设计[J].电子制作,2018(23):3-5+100.
[2] 李晓朋.语言识别技术的应用[J].电子技术与软件工程 .2016(23):156
[3] 祁艳飞,王茂森,戴劲松.语音控制在智能机器人中的应用 [J]. 仪表技术 .2015(7):45-49.
[4] 宋柏佑.机械臂语音控制系统研究 [D]. 西安科技大学 .2017.
[5] 唐米杰,李新国.基于语音识别与单片机控制的智能玩具设 计与实现 [J]. 计算技术与自动化 .2013,32(4):37-40.
[6] 陈松,王萍,李辉.基于单片机的语音识别机器人的设计 [J]. 才智 .2010(20):306-307.
[7] 钟晨帆.基于 LD3320 芯片的语音识别系统设计与开发 [D]. 南京大学 .2015.
作者简介:
杨帆,男(1999,10)辽宁抚顺人,本科,上海工程技术大学,电子电气工程学院,自动化,大三,研究方向:自动化.
基金项目:市级大学生创新训练项目编号cs1902007.