优势学习相关硕士博士期刊学术论文

为提高清洁能源消纳率及减少碳排放对环境的污染，实现更具泛化能力、鲁棒性和高效性的区域综合能源系统优化调度，该文提出了基于优势......

期刊

值函数估计在深度强化学习算法中应用广泛,并且在状态和动作空间较复杂的环境中可以解决传统强化学习中遭遇的维度灾难问题。因此,......

学位

深度强化学习是人工智能研究的热点领域之一,结合深度学习的感知能力和强化学习的决策能力,学界提出了基于深度模型的深度强化学习......

学位

根据心理学家威特金的理论,通过场独立性-依存性的实验研究,测定了男女学生在同一条件下所得出的不同结果,分析了男女学生在运动技......

期刊

场独立性场依存性认知方式优势学习

强化学习问题中,同一状态下不同动作所对应的状态-动作值存在差距过小的现象,Q-Learning算法采用MAX进行动作选择时会出现过估计问......

期刊