基于有限理性的期望强化学习算法在电力市场中的应用

来源 :应用数学 | 被引量 : 0次 | 上传用户：jimislg

【摘要】

：

在分析电力市场时,一般有效的工具是博弈论知识,经典博弈论研究的是理性的决策者.但实际上发电公司在决策时不可能采取完全理性的行为,即决策者的行为总是有限理性的,这是与

【作者】

：

黄金红周晓阳

【机构】

：

无锡商业职业技术学院基础部,华中科技大学数学系

【出处】

：

应用数学

【发表日期】

：

2007年S1期

【关键词】

：

有限理性期望强化学习算法 Roth-Erev强化学习算法期望利润实际利润 Limited rationality Aspiration enforcem

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在分析电力市场时,一般有效的工具是博弈论知识,经典博弈论研究的是理性的决策者.但实际上发电公司在决策时不可能采取完全理性的行为,即决策者的行为总是有限理性的,这是与现实相接近的,能更好的解释现实情况.因此以有限理性为分析前提,用期望强化学习算法来研究发电商行为的多样性给市场带来不同的均衡状态是有意义的.

其他文献

PageRank的改进算法——调整阻尼因子

Google将PageRank定义成某个非周期不可约Markov转移概率矩阵的平稳分布,于是对PageRank算法的改进所得到的矩阵一定要是非周期不可约Markov转移概率矩阵,结合RageRank算法和

期刊

PAGERANK算法Markov转移概率矩阵平稳分布改进算法PageRank algorithmMarkov probability transfer

基于双指数跳扩散模型的可转换债券定价

本文研究列维系统中的可转换债券的定价．我们证明了可转换债券中的隐含call部分的价值可转换为一个美式put．最后我们给出了在标的服从双指数跳扩散过程时隐含call的价值近似表

期刊

可转换债券列维过程美式put交换期权双指数跳扩散模型Convertible bond Levy processes American put

具非线性控制变量的非自治松驰系统时间最优追踪控制问题中的若干结果

本文讨论了一类广义非自治离散松驰系统的时间最优控制问题，将R^n中点曲线的目标约束推广为凸集值函数的超曲线约束．在证明了松驰系统与原系统可达集相等的基础上，得到了最优控

期刊

时间最优控制非自治松驰系统终端集值约束最大值原理阀函数Time optimal control Non-autonomous relaxed sys

基于半光滑方程的线性规划问题局部灵敏度分析

本文考虑线性规划的局部灵敏度问题.首先用非线性互补函数将线性规划问题的KKT系统转化为一个半光滑的方程组,然后利用半光滑函数的性质,得到一个能同时求所有变量（包括对偶变

期刊

线性规划NCP函数KKT系统灵敏度分析Linear programs NCP function KKT System Sensitivity

Banach空间中脉冲积分-微分方程的迭代解

利用单调迭代技术，本文首先讨论了Banach空间一阶脉冲积分一微分方程初值问题最大解与最小解的存在性．在此基础上，讨论了右端项中带有一阶导数的二阶脉冲积分一微分方程初值问题

期刊

初值问题脉冲积分-微分方程序BANACH空间最大解最小解Initial value problem Impulsive integro-differ

拟线性椭圆型方程带有混合奇异项的正整体解

在本文中，研究了方程div（｜↓△u｜p-2↓△u）＋f（x，u）=0，X∈R^N，N≥3的正整体解，其中f（x，u）在u=0未假定是正则的，且f（x,u）可以同时包含超线性，亚线性项和奇异项．

期刊

拟线性椭圆型方程上下解方法有界整体正解Quasilinear elliptic equations Upper and lower solution me

具有二步保费的Erlang（2）风险模型

本文考虑了当索赔间隔时间为Erlang（2）分布且保费收取为二步保费过程的复合更新风险模型，推导出该模型的罚金折现期望值函数满足具有一定边界条件和积分微分方程，并解出该方程．特

期刊

复合更新过程Erlang(2)分布积分微分方程罚金折现期望值函数破产时刻二步保费Compound renewal process Erlang （

时滞合作扩散系统的波前解

本文建立了两种群时滞合作系统波前解的存在性定理，扩展了单种群生物模型的结论．

期刊

波前解上下解Travelling wavefronts Supper and lower solution

一类离散事件动态系统极点分配的优化问题

应用极大代数作为数学工具,用系统矩阵的特征值法讨论了m×n-型离散事件动态系统极点分配的优化问题.给出了系统取得优化的条件.并证明了至少存在n个具有最优极点分配的

期刊

离散事件动态系统极点分配特征值法极大代数Cohen模型DEDS Pole assignment Eigenvalue-method Max-a

中立型随机泛函微分方程的有界性

本文主要讨论了中立型随机泛函微分方程的有界性．我们得到的结果本质上也是一种随机的LaSalle定理．

期刊

有界性半鞅收敛定理LaSalle定理ITO公式Boundedness Semimartingale convergence theorem LaSal

基于有限理性的期望强化学习算法在电力市场中的应用

与本文相关的学术论文