博弈学习理论中若干问题的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:skywing_wing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自二十世纪初,博弈论的理论体系建立以后,它获得了巨大的发展。并且,博弈论被广泛应用到了军事,经济,政治科学等领域。Nash均衡点是博弈论中一个非常重要的概念。Nash均衡点意味着,在收益最大化的假设下,每一个理性的参与者都不会有单独改变策略的冲动。博弈学习理论为Nash均衡点的产生或选择提供了一种较为符合实际的解释。详细地讲,Nash均衡点是有限理性的参与者为了达到最优,后悔最小或满意等目标,随着时间的逐步推移,利用自己所收集的信息进行策略或动作调整的长期结果。本文将对博弈学习理论中的若干问题进行讨论。第一章给出了关于博弈论,Nash均衡点,以及博弈学习理论的必要知识,并介绍了本文研究所涉及的主要问题。齐次噪音下的自适应学习过程可从数学上抽象为由随机扰动生成的不可约Markov链。第二章应用大偏差理论来分析,当随机扰动趋于零时,带随机扰动的Markov链的次极限行为或中期行为。通过将相应无扰动Markov链的极限点集迭代划分为不同阶的圈,本章研究了,当随机噪音趋于消失时,带随机扰动的Markov链在各个极限点之间进行遍历的最可能的次序,以及随机稳定均衡点的选择问题。第三章考虑了,一个对称博弈在多个位置同时进行的自适应学习过程。其中,每个位置中的期望水平依赖于其他可以观察到位置的平均表现。对这样的分散化信息结构,学习过程将收敛。对一大类的分散化信息结构和博弈,当期望水平的形成存在随机扰动时,Pareto最优的对称策略组将出现在唯一的随机稳定均衡点中。对囚徒困境,如果随机扰动发生的概率非常小,每个位置中的参与者将在大部分的时间里,都采用合作的策略。第四章为结论,简单总结了一下本文的工作,并讨论了未来可能的研究方向。
其他文献
目的探讨PDCA循环管理模式对小儿支气管肺炎的护理效果。方法选取2016年1月至2017年6月本科收治的90例小儿支气管肺炎患儿,按照随机数字表法分为观察组和对照组,每组45例。对
目的:探讨应用彩色多普勒超声诊断儿童神经母细胞来源性肿瘤的价值。方法:回顾性分析2005年3月~2008年9月间的19例小儿神经母细胞来源性肿瘤的彩色多普勒超声声像图表现。结果:19
生产要素拥塞问题是经济学和管理学研究的新领域。输入拥塞被认为是严重浪费资源,即输入的不适当增加不仅不会增加输出,反而会使输出减少。实际生产活动中,输入拥塞现象是可
档案管理工作随着社会发展,人们档案意识的提高愈发重要。但当前档案馆、档案管理科室等组织机构在档案管理中还存在弊端,影响了档案管理效率,更使档案应用率受到影响。本文从当
在山西省芦芽山自然保护区,有一种常被野生动物所能适应的特殊环境——向阳缓坡、岩石裸露、林疏草稀的单面石质山,当地人称"春暖山"。境内春暖花开时节,生活着多种美观漂亮
根据作者理论和试验方面的探索 ,从量子尺寸效应、小尺寸效应、表面效应及宏观量子隧道效应等方面分析了纳米粉体材料产生团聚的原因 ,并从制备、储运、使用等方面提出了具体
该文对已运行的云南电网公司曲靖供电局新建220kV尖山变电站,变压器SP泡沫喷雾灭火装置自动灭火保护系统控制回路进行了分析和探讨,对变电站变压器SP泡沫喷雾灭火装置保护系
目的:通过自制功能锻炼康复操来促进患者主动的进行功能锻炼,提高患者主动锻炼的能力。方法:成立乳腺主题病房,自制功能锻炼康复操,护士在旁指导直至患者掌握。结果:通过对50
脑卒中包括脑出血、脑梗死、蛛网膜下腔出血。现将149例脑卒中患者随机分为两组,干预组76和对照组73例,对照组进行常规内科治疗与护理,干预组除用常规内科治疗与护理外,开展
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield