论文部分内容阅读
摘 要:博弈论是解决各种现实问题的工具,高校图书馆自习室占座位在各个高校都是一个普遍存在的问题且一直没有相应的办法解决。本文通过博弈论及信息经济学建立图书馆管理员与学生的各自收益函数并建立相应模型,找出在纯战略纳什均衡和混合策略纳什均衡下图书馆管理员收书与学生占座位的概率,并在此基础上给出建议。
关键词:博弈;占座位;收益函数;均衡
一:基本假设
1.在整个过程中,博弈双方都是理性的。即对各自及对方的策略空间,收益函数都有明确的认识且都能在客观条件约束下做出最优化的实现其目标的理性决策。
2.到图书馆上自习学生总人数为N;且学生分为"不占座位"和"占座位"(此处占座位与否指占了座位不来上自习,去做别的事),不占座位学生所占比例为€%a,则不占座位学生总人数为N€讇%a;同理则占座位总人数为N€祝ǎ?€%a)。
3.管理员收书时随机地收N0名学生的书,则每一名学生的书被收到的概率为N0/N,且不会出现作弊的情况(即每次收书时旁边学生先把占座位学生的书拿到自己位子,从而避开了管理员的收书行为)。
4.收书与否根据管理员有无多余的时间,有则收,无则不收。作出的决定不受当时占座率的影响。
二:建立模型
根据假设知管理员与学生之间博弈属于有限次博弈,我们假设管理员的收益函数由:学生上自习人数给教师带来的效用,收书的成本,惩罚被收到占座位学生以促使其不占座位给所有同学带来的效用三部分组成。
其中,我们用函数f(x) (N€讇%a≤x≤N)表示学生上自习人数给管理员带来的效用(其中x表示上自习时不占座位学生的人数)。
收书的成本是指收书占用管理员处理有关图书馆日常工作的时间所带来的损失及由此带来的学生对管理员的反感等等。假设收每位学生书的单位成本为C0,则收书的总成本为C0€譔0。
惩罚被发现占座位学生,提高此学生的公共及公平的认识,同时在维护图书馆自习室正常秩序上为教师带来效用,所以由此带来的单位收益假设为M0。
而对于占座位学生占位子而方便做其他事情又可以在需要时上自习带来的效用为U,又因被发现占座位受到的懲罚为L,所以此时的总效用为U-L;而未被发现时总效用为U。当占座位学生选择到图书馆上自习,同时管理员查到其时避免了被发现占座位的风险,由此带来一些补偿效用为M,(因此时由于来上自习便不能做别的想做的事,所以效用为-U)进而总的效用即为-U+ M,但此时若未被查到则总的效用只有-U。
当占座位学生选择不来图书馆自习,此时上自习总人数为N€讇%a,若此时管理员选择收书,上自习人数带来的效用为f(N€讇%a),收书的成本为C0€譔0,惩罚被发现占座位学生带来的效用为M0N0€?1-€%a)。所以此时管理员的总收益为f(N€讇%a)+S0€譔0€?1-€%a)-C0€?N0。此时占座位学生的期望收益为(U- L)€?N0/N)+U€?1-N0/N)。
如果管理员选择不收书,此时学生上自习人数给教师带来的效用即为f(N€讇%a),收书成本与发现占座位学生带来的效用都为0,此时占座位学生由于占位未被发现而得到的总收益为U。
当占座位学生选择来图书馆,此时上自习人数为N。如果管理员选择收书则由上自习学生带来的效用为f(N),收书的成本为C0€譔0,惩罚占位学生带来的效用为0。所以管理员总效用为f(N)-C0€譔0,此时占座位被查到概率N0/N,所以此时被查到则收益为-U+ M,未被查到时效用为-U,所以此时占座位学生的总期望收益为(-U+ M)€?N0/N)-U€?1-N0/N)。
如果管理员不收书,学生上自习带来的效用为f(N),收书成本与惩罚占座位学生带来的效用均为0,所以管理员的总效用为f(N)。占座位学生此时的收益为-U。
即有如下博弈矩阵:
关键词:博弈;占座位;收益函数;均衡
一:基本假设
1.在整个过程中,博弈双方都是理性的。即对各自及对方的策略空间,收益函数都有明确的认识且都能在客观条件约束下做出最优化的实现其目标的理性决策。
2.到图书馆上自习学生总人数为N;且学生分为"不占座位"和"占座位"(此处占座位与否指占了座位不来上自习,去做别的事),不占座位学生所占比例为€%a,则不占座位学生总人数为N€讇%a;同理则占座位总人数为N€祝ǎ?€%a)。
3.管理员收书时随机地收N0名学生的书,则每一名学生的书被收到的概率为N0/N,且不会出现作弊的情况(即每次收书时旁边学生先把占座位学生的书拿到自己位子,从而避开了管理员的收书行为)。
4.收书与否根据管理员有无多余的时间,有则收,无则不收。作出的决定不受当时占座率的影响。
二:建立模型
根据假设知管理员与学生之间博弈属于有限次博弈,我们假设管理员的收益函数由:学生上自习人数给教师带来的效用,收书的成本,惩罚被收到占座位学生以促使其不占座位给所有同学带来的效用三部分组成。
其中,我们用函数f(x) (N€讇%a≤x≤N)表示学生上自习人数给管理员带来的效用(其中x表示上自习时不占座位学生的人数)。
收书的成本是指收书占用管理员处理有关图书馆日常工作的时间所带来的损失及由此带来的学生对管理员的反感等等。假设收每位学生书的单位成本为C0,则收书的总成本为C0€譔0。
惩罚被发现占座位学生,提高此学生的公共及公平的认识,同时在维护图书馆自习室正常秩序上为教师带来效用,所以由此带来的单位收益假设为M0。
而对于占座位学生占位子而方便做其他事情又可以在需要时上自习带来的效用为U,又因被发现占座位受到的懲罚为L,所以此时的总效用为U-L;而未被发现时总效用为U。当占座位学生选择到图书馆上自习,同时管理员查到其时避免了被发现占座位的风险,由此带来一些补偿效用为M,(因此时由于来上自习便不能做别的想做的事,所以效用为-U)进而总的效用即为-U+ M,但此时若未被查到则总的效用只有-U。
当占座位学生选择不来图书馆自习,此时上自习总人数为N€讇%a,若此时管理员选择收书,上自习人数带来的效用为f(N€讇%a),收书的成本为C0€譔0,惩罚被发现占座位学生带来的效用为M0N0€?1-€%a)。所以此时管理员的总收益为f(N€讇%a)+S0€譔0€?1-€%a)-C0€?N0。此时占座位学生的期望收益为(U- L)€?N0/N)+U€?1-N0/N)。
如果管理员选择不收书,此时学生上自习人数给教师带来的效用即为f(N€讇%a),收书成本与发现占座位学生带来的效用都为0,此时占座位学生由于占位未被发现而得到的总收益为U。
当占座位学生选择来图书馆,此时上自习人数为N。如果管理员选择收书则由上自习学生带来的效用为f(N),收书的成本为C0€譔0,惩罚占位学生带来的效用为0。所以管理员总效用为f(N)-C0€譔0,此时占座位被查到概率N0/N,所以此时被查到则收益为-U+ M,未被查到时效用为-U,所以此时占座位学生的总期望收益为(-U+ M)€?N0/N)-U€?1-N0/N)。
如果管理员不收书,学生上自习带来的效用为f(N),收书成本与惩罚占座位学生带来的效用均为0,所以管理员的总效用为f(N)。占座位学生此时的收益为-U。
即有如下博弈矩阵: