论文部分内容阅读
1 引言
该机器人决策系统工作在4万平方米水域,水深1.5米。其功能是收集水面固体垃圾、检测水质并根据水质投放水处理药剂、表演等。为了完成以上功能,系统采用人工神经网络进行决策。根据机器人工作环境特点,首先对其应用的神经网络数学模型进行了分析和建立,特别是引进了调整输入与输出关系的斜率因子,以便使系统的决策灵敏度提高,机器人决策或动作更敏捷。同时也研究了机器人的属性和抉择的对应关系。由于其特殊的工作环境,机器人的抉择结果存在许多复杂的模式识别、运动控制及大规模的组合及数据融合。传统方法对它们难以处理甚至是无能为力。在这里,神经网络的引入就可以较好地解决这些问题。随着神经网络理论研究和实际应用的不断深入,神经网络在机器人决策系统中的应用越来越受到人们的重视。
2 机器人决策设计
本系统采用前向神经网络作为机器人决策的理论依据,并将其看作是对输入与输出间的变换器,即输入向量x对输出y的一个映射。其变换原理可用数学模型推出。而后寻找建立模型的参数进行推导。
(1) 前向神经网络数学模型及算法
该模型数学表达式:
式中:
τij——输入和输出的延时;
Tj——神经元j的阀值;
wij——神经元i神经元j的突触连接系数或称权重值;
f()——神经元的转移函数(既符号函数)。
由输入列向量可以决定神经网络输入层的节点,在实际应用中,网络的输入层可以调节。每个结点的输入可以为n个,例如K输入单输出的神经元模型。对于单个神经元来讲,把它看成是微处理器毫不为过。
其实,人类对事务的判断与决策完全取决于它的信息量的性质。性质不同,其数学模型也完全不同。机器人通过视觉对图象理解并作出判断,进而给出决策时,首先对图象的特征信息进行处理,才能建立可靠运行、决策正确的数学模型。已知机器人的活动范围在4万平方米的水域中活动,需要决策的对象已在参考模板中,如何用神经网络实现机器人决策?神经网络对特征信息的训练精度,输入与输出间的数学模型的建立是非常关键的。因为水域中的图象是静止的,颜色基本为透明并呈现蓝色,这些参数设为固定的,所以我们采用图象压缩技术和灰度等级固定的参数使之成为背影,在机器人决策中不需要参与运算。机器人决策的激励对象是图象的特征参数,为一组列向量,它包括物体的颜色、形状、尺寸、物体的环境因素(风速、天气温度、湿度、季节等)等参数。根据机器人工作的具体环境,经过分析实验,找出输入与输出的关系符合线性函数,如图所示。
其中:
b 是背景参数;(水域背景)
C 是斜率,可以调整;
x 是输入列向量;(该值可能为正或负,与实际取值有关)
其斜率的取值反应了图象识别敏捷性。也间接地反应了机器人决策的灵敏性和可靠性。设输入与输出的线性关系斜率为C,C的取值根据系统调试来决定。斜率越大,神经网络训练越快,输出与参考模板匹配越快,系统灵敏度越高,机器人给出的决策也越机敏。
(2) 机器人决策分析
系统的决策最终表现为系统通过大量的信息处理之后作出的判断,即决定系统的最终的结果。例如:机器人从得到信息到作出判断或行动,则信息的误差率对决策有着至关重要的作用。人类对事物的认知很大程度上可以视为从属性描述中进行归纳的行为。机器人对事物的判断如同医生对病人的诊断,就是通过观察病例的有关属性即病症,掌握必要的数据后,再根据临床经验和知识作出判断。由此可见,基于属性的描述是一类重要的知识表示方法。系统中信息是以属性集的形式出现的,属性由属性名与可取值的范围来定义,所有的属性组成一个固有的属性集。
考虑系统的抉择问题,属性集由系统出现的初期状态和差错状态组成,通过这些状态信息来表征系统最后的异常,至于对应系统的抉择集具体的描述如下:
令FS是系统S的抉择集FS={f0,f1,f2,…,fn},具体含义在不同的系统中有所不同,在后面的示例中将给出一组对应该示例的含义。在机器人系统中,系统S的抉择集就是图形参考模板,它是具有学习功能的系统,这在以后的文章中阐述,在此仅把参考模板看作是不便的常数来分析。
ASi={A|A属性作为系统S的动态属性,能表示由抉择fi导致的差错}
IN_AS={Ak|Ak属性作为S的输入属性,能决定S动态特性}
由此得到系统S的抉择集FS对应的属性集AS,不妨设AS={A1, A2, A3,… ,Am}。t是可判断出系统S的抉择,下式表示抉择fi:
式中Aj(t)表示属性Aj在时刻t的取值,j = 1, 2,… ,m。 Φ也代表具体的作出抉择的方法。若把Φ看作是系统进行的抉择,则取值应是属性集AS在0—t 时间段上的所有取值,而抉择结果可能不仅仅是某个f ,而是FS中若干抉择结果的逻辑运算。因此从本质上讲,系统的抉择就是寻找获得的信息到系统抉择的映射。
属性集包括的数据为:正前方的图象信息、左方的图象信息、温度信息、右方的图象信息、水的质量信息、时间信息、自身所带的地图信息、天气信息。
最终的决策为:
决策一:向左运动 ← 左方有目标或前方有障碍物;
决策二:向右运动 ← 右方有目标或前方有障碍物;
决策三:向后退 ← 前方有障碍物(由正前方图象信息发现);
决策四:调节水质 ← 水质超标;
决策五:开始运动 ← 机器人初始状态S0;
决策六:停止工作 ← 由工作时间决定(定时器Tx);
决策七:调节地图信息 ← MAPx;
决策八:收集垃圾 ← 目标y出现;(y可以是参考模板中的机器人扑获对象中的任意一种垃圾);
决策九:调节运动的速度 ← 天气信息(温度、湿度、季节)。
学习过程如下:
① 选择训练样本。随机选取一定数量的属性抉择值对,以这些属性对作为训练用例。
② 学习训练。用学习算法进行训练,寻找出神经网络训练出的结果。
③ 对新增的属性决策对,在已有的神经网络的基础上,通过调整权值,进行争抢学习。
④ 检验抉择结果。对已形成的神经网络有其他的属性——抉择对进行验证,当抉择的正确率不满足要求的时候,则将那些不满足要求的用例增加到训练的用例中,返回到③重新进行学习,直到满足要求为止。
3 人工神经网络学习算法分析
这里假定神经元有两个状态,所以每个神经元定义输入空间上的一个超平面。各个神经元的连接权{wj}将通过梯度方法分别进行计算。训练的方式为实例教学,训练集是由例子矢量Xk及期望输出bk组成的模式对{Xk,bk}的集合。
神经元的变化函数为符号函数,一旦训练结束还是采用两状态神经元,其最小化准则是:
其中b=f(∑jwjxjk),这里f为符号函数。
学习规则表示为:
对单层结构,学习规则能确保收敛到均方最小解。如果类是线性可分的,该准则能对其进行较好地划分。一般情况下的δ学习规则的学习结果优于其他的学习算法。这里的叙述忽略了对神经阀值θ的讨论。因为这可以把θ视为已连接权。固定输入为-1,这样就可以将θ的学习合并到w中,即w0=θ。
这里主要介绍属性集的建立和属性集各个分量的含义,以及神经网络的学习过程。
4 神经网络的软件实现
神经网络软件要求在硬件平台上实现。编程语言可以是高级语言也可以是低级语言(汇编语言)。C语言是神经网络应用软件的基本编程工具,也可以使用MATLAB神经网络工具箱。目前流行的神经网络工具箱Neural Networks Toolbox2.0版本,它几乎概括了现有的神经网络的成果,涉及的网络模型有感知器。
5 结束语
本文将机器人的决策作为一种分类问题进行研究,采用两层前向神经网络算法进行机器人的决策。由于采用了神经网络,可以在训练的同时建立与问题对应的网络结构,因此确保了最终形成的网络的分类和抉择的能力。在保证学习精度的同时,又有算法较强的自适应学习能力,同时也保证了网络对新采集决策例子可以进行增量式的学习。
参考文献
[1]李士勇,模糊控制、神经控制和智能控制.哈尔滨:哈尔滨工业大学出版社,1998.
[2]赵林明,多层前向人工神经网络.郑州:黄河水利出版社,1999.
[3]何佳洲,周志华,陈兆乾.系统故障诊断的一种神经网络方法.计算机工程与应用,1996.
[4]韩力群.人工神经网络理论、设计及应用.北京:化学工业出版社,2004.
[5]周开利,康耀红.神经网络及其MATLAB仿真程序设计.北京:清华大学出版社,2005.
[6]阎平凡.人工神经网络与模拟进化计算.北京:清华大学出版社,2000.
[7]朱大奇,等.人工神经网络原理及应用.北京:科学出版社,2006.
[8]何为.基于神经元网络模型的稳压变压器优化设计,2001,38(9):24-25.
该机器人决策系统工作在4万平方米水域,水深1.5米。其功能是收集水面固体垃圾、检测水质并根据水质投放水处理药剂、表演等。为了完成以上功能,系统采用人工神经网络进行决策。根据机器人工作环境特点,首先对其应用的神经网络数学模型进行了分析和建立,特别是引进了调整输入与输出关系的斜率因子,以便使系统的决策灵敏度提高,机器人决策或动作更敏捷。同时也研究了机器人的属性和抉择的对应关系。由于其特殊的工作环境,机器人的抉择结果存在许多复杂的模式识别、运动控制及大规模的组合及数据融合。传统方法对它们难以处理甚至是无能为力。在这里,神经网络的引入就可以较好地解决这些问题。随着神经网络理论研究和实际应用的不断深入,神经网络在机器人决策系统中的应用越来越受到人们的重视。
2 机器人决策设计
本系统采用前向神经网络作为机器人决策的理论依据,并将其看作是对输入与输出间的变换器,即输入向量x对输出y的一个映射。其变换原理可用数学模型推出。而后寻找建立模型的参数进行推导。
(1) 前向神经网络数学模型及算法
该模型数学表达式:
式中:
τij——输入和输出的延时;
Tj——神经元j的阀值;
wij——神经元i神经元j的突触连接系数或称权重值;
f()——神经元的转移函数(既符号函数)。
由输入列向量可以决定神经网络输入层的节点,在实际应用中,网络的输入层可以调节。每个结点的输入可以为n个,例如K输入单输出的神经元模型。对于单个神经元来讲,把它看成是微处理器毫不为过。
其实,人类对事务的判断与决策完全取决于它的信息量的性质。性质不同,其数学模型也完全不同。机器人通过视觉对图象理解并作出判断,进而给出决策时,首先对图象的特征信息进行处理,才能建立可靠运行、决策正确的数学模型。已知机器人的活动范围在4万平方米的水域中活动,需要决策的对象已在参考模板中,如何用神经网络实现机器人决策?神经网络对特征信息的训练精度,输入与输出间的数学模型的建立是非常关键的。因为水域中的图象是静止的,颜色基本为透明并呈现蓝色,这些参数设为固定的,所以我们采用图象压缩技术和灰度等级固定的参数使之成为背影,在机器人决策中不需要参与运算。机器人决策的激励对象是图象的特征参数,为一组列向量,它包括物体的颜色、形状、尺寸、物体的环境因素(风速、天气温度、湿度、季节等)等参数。根据机器人工作的具体环境,经过分析实验,找出输入与输出的关系符合线性函数,如图所示。
其中:
b 是背景参数;(水域背景)
C 是斜率,可以调整;
x 是输入列向量;(该值可能为正或负,与实际取值有关)
其斜率的取值反应了图象识别敏捷性。也间接地反应了机器人决策的灵敏性和可靠性。设输入与输出的线性关系斜率为C,C的取值根据系统调试来决定。斜率越大,神经网络训练越快,输出与参考模板匹配越快,系统灵敏度越高,机器人给出的决策也越机敏。
(2) 机器人决策分析
系统的决策最终表现为系统通过大量的信息处理之后作出的判断,即决定系统的最终的结果。例如:机器人从得到信息到作出判断或行动,则信息的误差率对决策有着至关重要的作用。人类对事物的认知很大程度上可以视为从属性描述中进行归纳的行为。机器人对事物的判断如同医生对病人的诊断,就是通过观察病例的有关属性即病症,掌握必要的数据后,再根据临床经验和知识作出判断。由此可见,基于属性的描述是一类重要的知识表示方法。系统中信息是以属性集的形式出现的,属性由属性名与可取值的范围来定义,所有的属性组成一个固有的属性集。
考虑系统的抉择问题,属性集由系统出现的初期状态和差错状态组成,通过这些状态信息来表征系统最后的异常,至于对应系统的抉择集具体的描述如下:
令FS是系统S的抉择集FS={f0,f1,f2,…,fn},具体含义在不同的系统中有所不同,在后面的示例中将给出一组对应该示例的含义。在机器人系统中,系统S的抉择集就是图形参考模板,它是具有学习功能的系统,这在以后的文章中阐述,在此仅把参考模板看作是不便的常数来分析。
ASi={A|A属性作为系统S的动态属性,能表示由抉择fi导致的差错}
IN_AS={Ak|Ak属性作为S的输入属性,能决定S动态特性}
由此得到系统S的抉择集FS对应的属性集AS,不妨设AS={A1, A2, A3,… ,Am}。t是可判断出系统S的抉择,下式表示抉择fi:
式中Aj(t)表示属性Aj在时刻t的取值,j = 1, 2,… ,m。 Φ也代表具体的作出抉择的方法。若把Φ看作是系统进行的抉择,则取值应是属性集AS在0—t 时间段上的所有取值,而抉择结果可能不仅仅是某个f ,而是FS中若干抉择结果的逻辑运算。因此从本质上讲,系统的抉择就是寻找获得的信息到系统抉择的映射。
属性集包括的数据为:正前方的图象信息、左方的图象信息、温度信息、右方的图象信息、水的质量信息、时间信息、自身所带的地图信息、天气信息。
最终的决策为:
决策一:向左运动 ← 左方有目标或前方有障碍物;
决策二:向右运动 ← 右方有目标或前方有障碍物;
决策三:向后退 ← 前方有障碍物(由正前方图象信息发现);
决策四:调节水质 ← 水质超标;
决策五:开始运动 ← 机器人初始状态S0;
决策六:停止工作 ← 由工作时间决定(定时器Tx);
决策七:调节地图信息 ← MAPx;
决策八:收集垃圾 ← 目标y出现;(y可以是参考模板中的机器人扑获对象中的任意一种垃圾);
决策九:调节运动的速度 ← 天气信息(温度、湿度、季节)。
学习过程如下:
① 选择训练样本。随机选取一定数量的属性抉择值对,以这些属性对作为训练用例。
② 学习训练。用学习算法进行训练,寻找出神经网络训练出的结果。
③ 对新增的属性决策对,在已有的神经网络的基础上,通过调整权值,进行争抢学习。
④ 检验抉择结果。对已形成的神经网络有其他的属性——抉择对进行验证,当抉择的正确率不满足要求的时候,则将那些不满足要求的用例增加到训练的用例中,返回到③重新进行学习,直到满足要求为止。
3 人工神经网络学习算法分析
这里假定神经元有两个状态,所以每个神经元定义输入空间上的一个超平面。各个神经元的连接权{wj}将通过梯度方法分别进行计算。训练的方式为实例教学,训练集是由例子矢量Xk及期望输出bk组成的模式对{Xk,bk}的集合。
神经元的变化函数为符号函数,一旦训练结束还是采用两状态神经元,其最小化准则是:
其中b=f(∑jwjxjk),这里f为符号函数。
学习规则表示为:
对单层结构,学习规则能确保收敛到均方最小解。如果类是线性可分的,该准则能对其进行较好地划分。一般情况下的δ学习规则的学习结果优于其他的学习算法。这里的叙述忽略了对神经阀值θ的讨论。因为这可以把θ视为已连接权。固定输入为-1,这样就可以将θ的学习合并到w中,即w0=θ。
这里主要介绍属性集的建立和属性集各个分量的含义,以及神经网络的学习过程。
4 神经网络的软件实现
神经网络软件要求在硬件平台上实现。编程语言可以是高级语言也可以是低级语言(汇编语言)。C语言是神经网络应用软件的基本编程工具,也可以使用MATLAB神经网络工具箱。目前流行的神经网络工具箱Neural Networks Toolbox2.0版本,它几乎概括了现有的神经网络的成果,涉及的网络模型有感知器。
5 结束语
本文将机器人的决策作为一种分类问题进行研究,采用两层前向神经网络算法进行机器人的决策。由于采用了神经网络,可以在训练的同时建立与问题对应的网络结构,因此确保了最终形成的网络的分类和抉择的能力。在保证学习精度的同时,又有算法较强的自适应学习能力,同时也保证了网络对新采集决策例子可以进行增量式的学习。
参考文献
[1]李士勇,模糊控制、神经控制和智能控制.哈尔滨:哈尔滨工业大学出版社,1998.
[2]赵林明,多层前向人工神经网络.郑州:黄河水利出版社,1999.
[3]何佳洲,周志华,陈兆乾.系统故障诊断的一种神经网络方法.计算机工程与应用,1996.
[4]韩力群.人工神经网络理论、设计及应用.北京:化学工业出版社,2004.
[5]周开利,康耀红.神经网络及其MATLAB仿真程序设计.北京:清华大学出版社,2005.
[6]阎平凡.人工神经网络与模拟进化计算.北京:清华大学出版社,2000.
[7]朱大奇,等.人工神经网络原理及应用.北京:科学出版社,2006.
[8]何为.基于神经元网络模型的稳压变压器优化设计,2001,38(9):24-25.