论文部分内容阅读
这篇文章是关于如何利用博弈模型为搜索竞价系统中的广告商建立竞价行为模型的问题.简单而有效的竞价行为模型不仅能够帮助搜索引擎更好地服务广告商,而且还有助于改善拍卖机制以及预测未来收益.前人的一些相关工作或者不合理地假设广告商能够知道搜索竞价系统的状态和其他广告商的私人信息,或者忽略了广告商在市场信息搜集和优化竞价方面的能力的不同.为了解决这个问题,本文将搜索竞价系统看作带有私人信息的多人博弈系统,并且利用相应的加强学习行为模型描述该系统中广告商的竞价行为.该模型不再假定广告商具有完整的信息,而是假定他们只能根据自己在拍卖过程中观察到的部分信息来优化他们的决策.更进一步,本文提出的模型没有给出广告商具体的优化决策过程,而是利用相关参数来描述广告商不同的优化决策能力及学习能力.这些参数都可以利用系统中的历史数据,通过统计学习的方法得到.该模型的相关实验也证明了本文提出的模型可以提高广告商竞价和广告排序预测的准确性.除了预测广告商的短期行为,本文利用随机逼近的方法研究了该模型的收敛性.