基于有限理性的期望强化学习算法在电力市场中的应用

来源 :应用数学 | 被引量 : 0次 | 上传用户:jimislg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析电力市场时,一般有效的工具是博弈论知识,经典博弈论研究的是理性的决策者.但实际上发电公司在决策时不可能采取完全理性的行为,即决策者的行为总是有限理性的,这是与现实相接近的,能更好的解释现实情况.因此以有限理性为分析前提,用期望强化学习算法来研究发电商行为的多样性给市场带来不同的均衡状态是有意义的.
其他文献
Google将PageRank定义成某个非周期不可约Markov转移概率矩阵的平稳分布,于是对PageRank算法的改进所得到的矩阵一定要是非周期不可约Markov转移概率矩阵,结合RageRank算法和
本文研究列维系统中的可转换债券的定价.我们证明了可转换债券中的隐含call部分的价值可转换为一个美式put.最后我们给出了在标的服从双指数跳扩散过程时隐含call的价值近似表
本文讨论了一类广义非自治离散松驰系统的时间最优控制问题,将R^n中点曲线的目标约束推广为凸集值函数的超曲线约束.在证明了松驰系统与原系统可达集相等的基础上,得到了最优控
本文考虑线性规划的局部灵敏度问题.首先用非线性互补函数将线性规划问题的KKT系统转化为一个半光滑的方程组,然后利用半光滑函数的性质,得到一个能同时求所有变量(包括对偶变
利用单调迭代技术,本文首先讨论了Banach空间一阶脉冲积分一微分方程初值问题最大解与最小解的存在性.在此基础上,讨论了右端项中带有一阶导数的二阶脉冲积分一微分方程初值问题
在本文中,研究了方程div(|↓△u|p-2↓△u)+f(x,u)=0,X∈R^N,N≥3的正整体解,其中f(x,u)在u=0未假定是正则的,且f(x,u)可以同时包含超线性,亚线性项和奇异项.
本文考虑了当索赔间隔时间为Erlang(2)分布且保费收取为二步保费过程的复合更新风险模型,推导出该模型的罚金折现期望值函数满足具有一定边界条件和积分微分方程,并解出该方程.特
本文建立了两种群时滞合作系统波前解的存在性定理,扩展了单种群生物模型的结论.
应用极大代数作为数学工具,用系统矩阵的特征值法讨论了m×n-型离散事件动态系统极点分配的优化问题.给出了系统取得优化的条件.并证明了至少存在n个具有最优极点分配的
本文主要讨论了中立型随机泛函微分方程的有界性.我们得到的结果本质上也是一种随机的LaSalle定理.