基于神经网络的机器人决策系统

来源 :网络与信息 | 被引量 : 0次 | 上传用户：colinzeng76

【摘要】

：

【作者】

：

董砚秋　高　海　郭　巍

【出处】

：

网络与信息

【发表日期】

：

2008年6期

【关键词】

：

机器人决策信息处理神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　1 引言
　　
　　该机器人决策系统工作在4万平方米水域，水深1.5米。其功能是收集水面固体垃圾、检测水质并根据水质投放水处理药剂、表演等。为了完成以上功能，系统采用人工神经网络进行决策。根据机器人工作环境特点，首先对其应用的神经网络数学模型进行了分析和建立，特别是引进了调整输入与输出关系的斜率因子，以便使系统的决策灵敏度提高，机器人决策或动作更敏捷。同时也研究了机器人的属性和抉择的对应关系。由于其特殊的工作环境，机器人的抉择结果存在许多复杂的模式识别、运动控制及大规模的组合及数据融合。传统方法对它们难以处理甚至是无能为力。在这里，神经网络的引入就可以较好地解决这些问题。随着神经网络理论研究和实际应用的不断深入，神经网络在机器人决策系统中的应用越来越受到人们的重视。
　　
　　2 机器人决策设计
　　
　　本系统采用前向神经网络作为机器人决策的理论依据，并将其看作是对输入与输出间的变换器，即输入向量x对输出y的一个映射。其变换原理可用数学模型推出。而后寻找建立模型的参数进行推导。
　　
　　(1) 前向神经网络数学模型及算法
　　
　　该模型数学表达式：
　　

　　式中：
　　τ_ij——输入和输出的延时；
　　T_j——神经元j的阀值；
　　w_ij——神经元i神经元j的突触连接系数或称权重值；
　　f()——神经元的转移函数（既符号函数）。
　　由输入列向量可以决定神经网络输入层的节点，在实际应用中，网络的输入层可以调节。每个结点的输入可以为n个，例如K输入单输出的神经元模型。对于单个神经元来讲，把它看成是微处理器毫不为过。
　　其实，人类对事务的判断与决策完全取决于它的信息量的性质。性质不同，其数学模型也完全不同。机器人通过视觉对图象理解并作出判断，进而给出决策时，首先对图象的特征信息进行处理，才能建立可靠运行、决策正确的数学模型。已知机器人的活动范围在4万平方米的水域中活动，需要决策的对象已在参考模板中，如何用神经网络实现机器人决策？神经网络对特征信息的训练精度，输入与输出间的数学模型的建立是非常关键的。因为水域中的图象是静止的，颜色基本为透明并呈现蓝色，这些参数设为固定的，所以我们采用图象压缩技术和灰度等级固定的参数使之成为背影，在机器人决策中不需要参与运算。机器人决策的激励对象是图象的特征参数，为一组列向量，它包括物体的颜色、形状、尺寸、物体的环境因素（风速、天气温度、湿度、季节等）等参数。根据机器人工作的具体环境，经过分析实验，找出输入与输出的关系符合线性函数，如图所示。
　　其中：
　　b 是背景参数；（水域背景）
　　C 是斜率，可以调整；
　　x 是输入列向量;（该值可能为正或负，与实际取值有关）
　　

　　其斜率的取值反应了图象识别敏捷性。也间接地反应了机器人决策的灵敏性和可靠性。设输入与输出的线性关系斜率为C，C的取值根据系统调试来决定。斜率越大，神经网络训练越快，输出与参考模板匹配越快，系统灵敏度越高，机器人给出的决策也越机敏。
　　
　　(2) 机器人决策分析
　　
　　系统的决策最终表现为系统通过大量的信息处理之后作出的判断，即决定系统的最终的结果。例如：机器人从得到信息到作出判断或行动，则信息的误差率对决策有着至关重要的作用。人类对事物的认知很大程度上可以视为从属性描述中进行归纳的行为。机器人对事物的判断如同医生对病人的诊断，就是通过观察病例的有关属性即病症，掌握必要的数据后，再根据临床经验和知识作出判断。由此可见，基于属性的描述是一类重要的知识表示方法。系统中信息是以属性集的形式出现的，属性由属性名与可取值的范围来定义，所有的属性组成一个固有的属性集。
　　考虑系统的抉择问题，属性集由系统出现的初期状态和差错状态组成，通过这些状态信息来表征系统最后的异常，至于对应系统的抉择集具体的描述如下：
　　
　　令FS是系统S的抉择集FS={f₀,f₁,f₂,…,fn},具体含义在不同的系统中有所不同，在后面的示例中将给出一组对应该示例的含义。在机器人系统中，系统S的抉择集就是图形参考模板，它是具有学习功能的系统，这在以后的文章中阐述，在此仅把参考模板看作是不便的常数来分析。
　　ASi={A|A属性作为系统S的动态属性，能表示由抉择f_i导致的差错}
　　IN_AS={Ak|Ak属性作为S的输入属性，能决定S动态特性}
　　由此得到系统S的抉择集FS对应的属性集AS,不妨设AS={A₁, A₂, A₃,… ,A_m}。t是可判断出系统S的抉择，下式表示抉择f_i：
　　

　　式中Aj(t)表示属性Aj在时刻t的取值，j = 1, 2,… ,m。 Φ也代表具体的作出抉择的方法。若把Φ看作是系统进行的抉择，则取值应是属性集AS在0—t 时间段上的所有取值，而抉择结果可能不仅仅是某个f ，而是FS中若干抉择结果的逻辑运算。因此从本质上讲，系统的抉择就是寻找获得的信息到系统抉择的映射。
　　属性集包括的数据为：正前方的图象信息、左方的图象信息、温度信息、右方的图象信息、水的质量信息、时间信息、自身所带的地图信息、天气信息。
　　
　　最终的决策为：
　　
　　决策一：向左运动 ← 左方有目标或前方有障碍物；
　　决策二：向右运动 ← 右方有目标或前方有障碍物；
　　决策三：向后退 ← 前方有障碍物（由正前方图象信息发现）；
　　决策四：调节水质 ← 水质超标；
　　决策五：开始运动 ← 机器人初始状态S0；
　　决策六：停止工作 ← 由工作时间决定（定时器Tx）；
　　决策七：调节地图信息 ← MAPx；
　　决策八：收集垃圾 ← 目标y出现；（y可以是参考模板中的机器人扑获对象中的任意一种垃圾）；
　　决策九：调节运动的速度 ← 天气信息（温度、湿度、季节）。
　　
　　学习过程如下：
　　
　　① 选择训练样本。随机选取一定数量的属性抉择值对，以这些属性对作为训练用例。
　　② 学习训练。用学习算法进行训练，寻找出神经网络训练出的结果。
　　③ 对新增的属性决策对，在已有的神经网络的基础上，通过调整权值，进行争抢学习。
　　④ 检验抉择结果。对已形成的神经网络有其他的属性——抉择对进行验证，当抉择的正确率不满足要求的时候，则将那些不满足要求的用例增加到训练的用例中，返回到③重新进行学习，直到满足要求为止。
　　
　　3 人工神经网络学习算法分析
　　
　　这里假定神经元有两个状态，所以每个神经元定义输入空间上的一个超平面。各个神经元的连接权{w_j}将通过梯度方法分别进行计算。训练的方式为实例教学，训练集是由例子矢量X_k及期望输出b_k组成的模式对{X_k，b_k}的集合。
　　神经元的变化函数为符号函数，一旦训练结束还是采用两状态神经元，其最小化准则是：
　　

　　其中b=f(∑_jw_jx_j^k),这里f为符号函数。
　　学习规则表示为：
　　

　　对单层结构，学习规则能确保收敛到均方最小解。如果类是线性可分的，该准则能对其进行较好地划分。一般情况下的δ学习规则的学习结果优于其他的学习算法。这里的叙述忽略了对神经阀值θ的讨论。因为这可以把θ视为已连接权。固定输入为－1，这样就可以将θ的学习合并到w中，即w₀=θ。
　　这里主要介绍属性集的建立和属性集各个分量的含义，以及神经网络的学习过程。
　　
　　4 神经网络的软件实现
　　
　　神经网络软件要求在硬件平台上实现。编程语言可以是高级语言也可以是低级语言（汇编语言）。C语言是神经网络应用软件的基本编程工具，也可以使用MATLAB神经网络工具箱。目前流行的神经网络工具箱Neural Networks Toolbox2.0版本，它几乎概括了现有的神经网络的成果，涉及的网络模型有感知器。
　　
　　5 结束语
　　
　　本文将机器人的决策作为一种分类问题进行研究，采用两层前向神经网络算法进行机器人的决策。由于采用了神经网络，可以在训练的同时建立与问题对应的网络结构，因此确保了最终形成的网络的分类和抉择的能力。在保证学习精度的同时，又有算法较强的自适应学习能力，同时也保证了网络对新采集决策例子可以进行增量式的学习。
　　
　　参考文献
　　[1]李士勇,模糊控制、神经控制和智能控制.哈尔滨：哈尔滨工业大学出版社,1998.
　　[2]赵林明,多层前向人工神经网络.郑州：黄河水利出版社,1999.
　　[3]何佳洲,周志华,陈兆乾.系统故障诊断的一种神经网络方法.计算机工程与应用,1996.
　　[4]韩力群.人工神经网络理论、设计及应用.北京：化学工业出版社,2004.
　　[5]周开利，康耀红.神经网络及其MATLAB仿真程序设计.北京：清华大学出版社,2005.
　　[6]阎平凡.人工神经网络与模拟进化计算.北京：清华大学出版社,2000.
　　[7]朱大奇,等.人工神经网络原理及应用.北京：科学出版社,2006.
　　[8]何为.基于神经元网络模型的稳压变压器优化设计,2001，38（9）：24－25.

其他文献

浅谈水利工程投标中的报价技巧

介绍了水利工程在投标中的报价技巧和方法。投标过程中的投标报价,对施工企业投标的成败和将来实施工程的盈亏起着决定性的作用。

期刊

水利工程投标报价技巧

Ctrl键在WORD中的妙用

“Ctrl”键在Word中的作用很大，和其他不同的键组合起来使用，可发挥更大的作用。

期刊

CTRL键WORD“Ctrl”键WORD

网站推广大集合

1.千言万语汇成一句话：先把网站的内容做好！　　　　不过，这里千万要强调一点：不要迷信“原创”，切忌不顾一切原创内容，我们要做的是把内容整合好，就像一个好厨师用好手艺做好菜，而不是自己去喂猪。我们要做的就是内容整合，形成具有足够吸引力的鲜明主题。事实上，这就足够了！　　　　2.网站标题栏（Title）的内容优化　　　　先写好一个简要的介绍，不超过30字，然后将其改编，尽可能合理地导入与网站所在行业

期刊

网站推广集合吸引力原创整合

避免出现“一夜回到解放前”为游戏帐号保驾护航

辛辛苦苦大半年，一夜回到解放前！这是很多网游爱好者最不堪回首的经历，如何避免这种情况再次出现或压根就别出现呢？　　现在网络游戏的盗号非常严重，防不胜防，虽然我们平时已经非常小心了，但是还是难免中招，其实我们可以用一些专门保护帐号的软件来保护你的网络游戏的安全，奇虎360保险箱就是一个很不错的软件，它除了可以保护网络游戏外，还可以用来保护网络银行帐号、股票证券帐号、聊天帐号等，下面就来介绍一下具体的

期刊

游戏帐号护航网络安全网络游戏

小技巧助你轻松卸载IE8

一些朋友为了尝鲜，安装了IE8浏览器，但是因为某些原因想还原为以前的低版本浏览器，该如何操作呢？首先要确定你安装的IE8版本，同时要确认的是你的操作系统。删除InternetEXplorer8（I

期刊

INTERNETEXPLORER卸载操作系统浏览器松版本自定义收藏夹

《C＋＋程序设计》课程教学方法探讨

C＋＋具有强大的功能，是目前最流行的面向对象的编程语言，为广大编程者和学习者所青睐《C＋＋程序设计》课程也已经成为计算机软件技术专业的核心基础课程。通过《C＋＋程序设计》课程的学

期刊

《C++程序设计》基础课程教学方法面向对象程序设计计算机软件技术编程语言语法规则VC++

负压直抽式分选系统在华能济宁电厂的应用

介绍了华能济宁电厂灰处理系统的改造，就负压直抽式分选系统的设计、调试和运行进行了详细说明，并对2种分选工艺进行了技术经济性比较，指出了负压直抽式分选系统在采用水冲灰的

期刊

粉煤灰负压直抽式分选系统设计调试

巧用DOS命令快速把系统看个透

假如你的电脑出了问题，在线向各路高手请教时，免不了要被问一些CPU是什么、BIOS版本是什么、操作系统是什么、内存多大、安装过什么补丁之类的问题，如果你是新手，可能一下子还真

期刊

DOS命令操作系统巧用BIOSCPU电脑在线内存

合理设置Win 7自动播放让系统速度更快

Windows XP和Windows 7在处理USB设备插入时,都会弹出对话框询问用户需要进行什么样的操作。不同的是,Windows XP会随着打开文件类型的增多,而不断地添加（文件类型）,而Windows

期刊

合理设置自动播放WINDOWS速度系统文件类型USB设备用户需要

干掉DLL后门的方法

动态链接程序库，全称：Dynamic Link Library，简称：DLL，作用在于为应用程序提供扩展功能。应用程序想要调用DLL文件，需要跟其进行“动态链接“；从编程的角度，应用程序需要知道DLL文件

期刊

DLL文件后门DYNAMICLIBRARYWindows应用程序程序调用动态链接

基于神经网络的机器人决策系统

与本文相关的学术论文