论文部分内容阅读
随着电子商务的快速发展,网络广告以及商品越来越多,网络广告的点击率一直是相关企业关注的方向,但是随着广大用户厌倦了无关广告的推送,用户逐渐对广告产生了“免疫”,因而导致近年来CTR的大幅下降。因此对于展示广告而言,网络运营商、广告中介商和广告主都希望能有效提高广告的点击率,同时为用户展示最有针对性和最有帮助的广告,从而赚取更多的广告利润或形成更多的潜在销售收益,因此找出影响CTR的关键因素并采取针对性措施的也就显得万分重要。本文基于中文分词、主题提取以及灰色预测模型等核心算法,对网购网站用户行为分析进行了研究。在论文中,通过研究不同的中文分词方案并对比其效率,接着选取有效的中文分词算法对对特定用户的行为访问日志的分析处理建立可以用于主题提取的字段,然后运用灰色预测模型得到该用户可能感兴趣的相关主题的商品或者广告,从而有针对性的对特定用户进行相关度较高的广告推送或者对特定广告进行向关注度较高的用户推送,其核心目标就是提高CTR预测结果,从数学模型的角度来提高网页广告的最大相关度来使得企业获得更大的利润。本文探究的是如何将数据挖掘、预测模型建立和预测度量进行有机的结合,达到预测结果和用户行为的极大契合,保证了广告不对用户浏览进行干扰的情况,同时为用户带来相关推荐,并且将网站的收入最大化。本设计的基本流程是根据用户的历史访问记录,提出一种用户行为特征模型,并使用灰色预测模型进行相关预测,得到该用户将来点击的结果;与此同时,通过一定的主题提取算法对用户历史数据以及广告数据进行主题提取;接着使用空间向量模型对预测结果与广告主题进行相关度计算,最后以权值(相关度)由高到低的顺序进行排列,以此来完成广告或者商品的推送。该设计的最终成果将可以加入到更大的电子商务系统或者广告推送系统,以模块化的形式共同完成一系列功能的实现。