基于强化学习算法的电梯调度系统的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:yellowuncle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高层建筑的不断增多和智能建筑的快速发展,人们对建筑物内的客流运输设备电梯提出了越来越高的要求。为了提高电梯的运输能力和服务质量,实现多台电梯的有效控制——电梯调度,正越来越成为人们研究的热点问题。 本文主要研究了电梯群组调度问题。电梯交通流随时间变化呈现出规律各异的多种交通模式,所以本文在处理交通流分析问题的过程中,将聚类思想引入电梯交通流分析,并提出了一种新型的人工免疫聚类算法。对电梯交通流进行交通模式的聚类分析和模式识别,突破了传统的四种交通流模式:空闲、随机层间、上高峰和下高峰模式的局限,将交通流细分为7种模式,便于提高后续进行电梯动态调度研究的准确度,同时计算出各模式对应的浓度和聚类中心,方便对交通流的在线模式识别。 在解决电梯群组调度这种大规模动态优化问题时,本文采用强化学习方法作为在与环境的交互过程中学习最优策略的方法。以马尔可夫决策过程(MDP)为背景,模型化电梯群组调度问题,综合考虑平均等待时间、平均乘梯时间和电梯停靠次数这三个因素,计算出的综合成本作为性能评价的综合指标。采用随机行为选择策略和前馈神经网络分别解决强化学习在应用中所存在的探索问题和值函数的泛化问题。并将两者与Q-learning的值迭代算法结合,共同构成基于强化学习的电梯群组调度算法。最后,构建了基于泊松分布的大楼客流交通模型,并设计了基于强化学习的电梯群组调度系统,利用MATLAB仿真,结果证明,在对交通流进行反复训练时,Q值曲线间的误差是逐渐减小的,说明了本文使用的强化学习方法对Q值函数的逐渐逼近作用。在5种不同的交通流条件下,基于强化学习的动态调度方法与其它方法比较呈现出一定的优越性,尤其在上高峰模式和随机层间模式下有更好的适用性,充分说明了基于强化学习的电梯群组动态调度算法的有效性和可行性。
其他文献
目前,计算机网络已广泛应用于各行业中,并发挥着至关重要的作用。但是由于设计不合理、施工不当或自然环境等因素的影响,往往会使网络线缆受损,从而导致数据传输混乱,甚至网络通信完全中断,造成巨大的经济损失。因此迅速发现、定位网络线缆故障对维护网络正常运行故障显得十分重要。网络线缆测试模块是实验室承担的科研项目“网络故障测试仪”的重要组成部分,先前设计已基本实现断点故障定位、接线图测试等功能,但还存在一些
金属断口的识别与分类对于改进设备,防止构件发生断裂具有一定的指导意义。利用立体对成像技术可以获得断裂表面的完整三维信息,这为深入理解断裂微观过程提供了良好的基础。
本文在主要研究多目标优化状态反馈控制问题。在近十年内,随着数学领域内解线性矩阵不等式(LMI)的内点法的出现,线性矩阵不等式的解法有了突破性的进展。本文利用LMI方法研究
欠驱动系统是一类控制输入数目少于系统广义坐标变量(或自由度)数目的非线性系统。它是由驱动关节和非驱动关节组成的,由驱动关节通过动力学耦合关系带动非驱动关节完成所需的
本文对基于TMS320C6711DSP的实时人脸识别系统进行了研究。主要内容如下: 第一,针对系统的实时性、图像处理大数据量、人脸识别算法的复杂性等特点,根据DSP的特点,选用一套基
机车监控系统是由我国科技人员研制的以保障机车运行安全为目的,综合地面信息、机车自身状况以及机车信号信息对机车运行速度进行监测,进而控制机车运行的列车安全运行监控装
实验教学在高等工科教育中起着相当重要的作用,应用虚拟仪器来进行实验教学已经形成了一个趋势。本课题在原有的虚拟仪器测试平台软、硬件的设计基础上,设计了一个带频谱分析
钢铁行业是关系到国家安全和国民经济命脉的重要行业,高炉炼铁是钢铁行业中的一个非常关键的工序。高炉炼铁工序是在一个密闭的容器中进行的,发生的物理化学变化异常复杂,波动性
随着微电子技术、传感器技术、嵌入式计算技术以及通信技术的飞速发展,产生和发展了具有感知、计算、存储和通信能力的无线传感器网络。传感器节点通过自组织的方式构成网络,能
在现在的公路交通管理中,交警需要随身携带许多设备。本课题的目标是设计信息化集成交通管理系统,在信息化集成管理系统实现后,交警只需要一个小巧的手持PDA,就可以完成工作