论文部分内容阅读
直复营销即一种可以得到客户直接回应的营销模式。作为企业的一项长期性经营活动,直复营销贯穿于企业发展的整个过程,因此,通常将长期收益作为评价营销效果的指标。近年来,随着智能化的快速发展,越来越多的企业希望借助机器学习的力量进行营销决策,但是传统的监督学习和非监督学习方法在处理该问题时只能最大化单个决策的即时收益,而直复营销需要随时间的推移进行连续决策,因而这两类方法具有很大的局限性。强化学习是机器学习的重要组成部分,主要用于解决序贯决策问题。它通过智能体持续地与环境进行交互,并从环境反馈的延迟奖赏中学