马尔科夫决策相关论文
实时广告竞价(Real-Time Bidding,RTB)目前是现代互联网广告行业普遍采用的流量交易方法,结合大数据技术能够做到广告针对相应用户的......
电动汽车的碳排放较低,近年来受到越来越广泛的推广应用。然而,现阶段大量电动汽车随机接入充电,导致充电需求在时空上分布不均匀,......
作为矿区的主要生产要素,露天矿卡车运输对安全有很强的需求,运输“无人化”可减少运维成本,对危险、恶劣的工作环境有一定适应能......
多目标检测和跟踪方法是目前视觉领域的重要组成部分,该方法已经广泛应用于智能驾驶、公共安防等领域。由于复杂多变的现实环境、......
为实现装备自动匹配,尽可能高效利用装备资源,发挥整体作战效能,提出并分析了装备组合运用问题.探讨了深度强化学习的原理,建立了......
本文基于马尔科夫决策过程提出一种燃料电池汽车最优等效氢燃料消耗控制策略.控制策略以部分观测量为基础,以马尔科夫转移概率矩阵......
为优化铁路客运专线车站的设计,研究了考虑不同发车频率的客流生成机制,应用标准的马尔可夫决策过程描述了乘客在车站内的集散过程......
随着社会经济与科技的发展,人们对能源的需求与消耗日益严峻。而在通信产业,随着从环境直接获取能量技术的不断发展和趋向成熟,如何高......
近年来,数字电子技术的发展使得数字视频成为多媒体通信系统最重要的信息载体,数字视频与图像、音频等信息形式相比,数据量要大得......
能量收集无线传感器网络是指具有能量收集能力的传感器节点感知、获取和协作传输被监控对象数据的网络,可以保证节点能量不会被耗......
本文研究了基于马尔科夫决策过程(Markov Decision Process, MDP)的时延敏感业务的跨层调度问题。在基于TDMA的多用户单业务调度系......
桥梁是工程师们尽心缔造的艺术品,艺术品的设计基准期长达100年。因而对桥梁的优化设计不能只考虑结构设计之初的结构状况,而应系......
对前方多车辆的跟踪在交通场景分析中扮演着重要角色,如高级驾驶辅助系统(Advanced Driver Assistance Systems,ADAS)中自适应巡航......
在互联网和大数据的背景下,推荐系统已经在各个领域内得到广泛的应用,并成为互联网服务中的一个重要组成部分。根据实际需求,推荐......
文章提出了基于部分可视马尔科夫决策过程(POMDP)的分布式多用户机会频谱接入的算法:“碰撞驱动随机化”(CDR)。该算法相对稳定但......
本文考虑了一个由三种组件、两类终端产品、每类产品只有一类顾客需求的W型ATO系统,在假设各组件生产时间相互独立且服从指数分布......
在产品更新换代频繁的今天,如何以更低的成本满足市场日益多样化需求成为企业管理者面临的难题之一,也是学术界关注的主要问题之一。......
近年以来,由于全球化市场的加速形成,技术变革的加速,围绕产品的市场竞争日趋激烈,制造业正发生着深刻的变革。随着制造业的快速发......
本论文主要讨论多目标、多指标、多阶段以及信息不完全决策分析方法在工业安全领域中的应用.多目标决策问题是指在决策分析中,决策......
0引言 降低“能耗”是现代社会最紧要的问题之一。仪器中电源消耗的能源占了总能耗的一大块,本文就如何降低电源的能耗同时保障......
对公共空间中的多目标行人轨迹跟踪问题,提出一种基于强化学习的多目标行人轨迹跟踪算法。首先采用高精确度的目标检测器检测公共......
本文对费用函数无界但可控情形下的有限阶段马尔科夫决策模型进行了研究.本文给出了有限阶段马尔科夫决策过程的最优策略存在的条......
由于容迟容断网络面临的应用环境极为特殊,传统网络的路由协议无法适用于容迟容断网络.为了提高容迟容断网络的传输效率,同时减小......
针对由两种组件、三类顾客需求组成的按单装配系统,奉文研究了其中的组件生产控制与库仔分配问题.在各类顾客需求是泊松到达过程,各种......
本文利用马尔科夫决策理论,提出了一种动态顾客识别--定价模型,指出对于不同的顾客采取不同的定价策略,能使企业在竞争激烈的环境......
随着新一代信息通信领域的快速发展,高效稳定的数据转发策略,逐渐成为深度信息交互的通信基础,受到广大科学工作者的青睐。当前,在......
移动机会网络(Mobile opportunistic network,MON)是无线移动通信中一种新兴的通信方式。MON被定义为一种节点之间的通信会频繁地......
市场竞争加剧和顾客需求多样化加剧了供需的不平衡,并由此导致了缺货与滞销并存,造成顾客满意度的降低和顾客群体的流失。现有库存......
【正】0引言降低"能耗"是现代社会最紧要的问题之一。仪器中电源消耗的能源占了总能耗的一大块,本文就如何降低电源的能耗同时保障......
空载出租车的马尔科夫决策行动决定了出租车的城市区域分布。根据马氏平稳条件及出租车行业统计规律,计算了空载车区域分布集X空和......
煤和金属等矿产是国家发展不可或缺的重要资源,其中绝大多数均是通过井下开采的方式获取。尽管多年以来国家一直非常重视井下安全......
马尔科夫决策多目标跟踪算法在目标遮挡和目标消失再出现等情况下容易丢失目标,无法进行持续有效的跟踪。利用核相关滤波器较强的......
一致性聚类本质上是一个组合优化问题,这已经被证明是NP完全型难题,主要困难在于从不同聚类算法的输出结果中求出一个共识聚类。在......
频率资源稀缺和节省能耗是当前无线通信研究中的两个重要问题。为此,我们以无线通信中高频谱效率和高能量效率的功率管理作为本论......
将呈现随机"好"、"坏"状态跳变的深空Ka频段链路噪声温度建模为两状态Gilbert-Elliot信道,考虑深空下行发送端只能获得延迟的信道状态......
主要描述生产设备管理过程中维修方式的选择和最佳更新时间的决策方法。根据设备的状态运用马尔科夫决策来确定采用何种维修方式,......
以公交系统中的个体学习行为为研究对象,通过构建出行者面对动态出行环境的选择行为模型,使用基于多智能体的仿真方法,模拟公交运......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到......
强化学习是机器学习的一个重要分支,其优点是不需要先验知识,通过与环境的交互进行试错学习。与有导师学习不同,强化学习没有得到......
如今,科技的力量渗透在各行各业。作为一股新的科技力量,无人机在各行各业的应用前景备受关注。其中无人机在军事目标搜索系统中搜......
“互联网+交通”新形态的出现,使得出租车行业发生了巨大的变化,网约车作为出行的新方式给传统出租车带来了明显的冲击。与此同时,......
固定通信台站装备维修需要考虑多维修岗位下共用维修人员的优化配置策略。决策者可以将维修人员动态的分配至各个维修岗位处理维修......