论文部分内容阅读
从海量的零售信息中提取有意义的数据为企业营销创造价值是众多企业共同需要解决的问题,然而面对海量数据如果仅仅采用传统的统计方法来分析不仅无法满足大数据环境下高效处理的要求,而且往往很难得到想要的结果,同时由于海量数据中存在的模糊性与不确定的表达将使得数据建模变得更加困难,也就无从开展精准推送营销,基于此本文从海量的零售数据中提取衡量客户价值的RFM模型指标,通过RFM模型指标提取客户特征属性构建用户画像标签,对用户画像标签的模糊性与不确定性通过云模型和本体思想来构建用户画像模型,从而实现面向消费市场的精准推送。具体研究内容如下:(1)数据预处理:如何从海量的零售信息中提取用户的共同特征,本文从海量的零售信息数据库中按照分层抽样的思想随机抽取具有代表性的样本数据,在保证抽样数据符合标准格式要求的前提下,重点研究了在海量数据环境下如何实现最优分配以及如何对抽样性能评估,保证样本数据在一定条件下能够反映全量数据的整体全貌。(2)用户画像标签处理:从抽样数据中提取RFM模型指标,针对抽样数据中该类指标的不确定性与模糊性的特点,本文引入云模型理论和本体技术,通过高斯云发生器将RFM指标转换为基于云模型的RFM指标(时间间隔云模型、消费频率云模型、消费金额云模型)来构建群体价值画像标签体系,通过本体思想对用户属性进行表示、解释和推理来构建用户个体画像标签体系。(3)用户画像建模:用户画像力求借助用户个性化的标签来反映用户信息全貌,标签的选取直接影响用户画像的建模的成功与否,本文基于云模型的RFM指标构建用户价值画像模型,同时通过用户个体属性来构建个体用户画像模型。为了对云模型领域的用户画像聚类分析,本文对传统的K-Means聚类算法进行改进,设计了基于云模型的聚类算法。在该算法的基础上可以根据具体的业务场景得到不同的用户画像模型。(4)精准推送阶段:通过云模型画像聚类对客户群体进行价值分类,建立群体与服务之间的关联,通过本体推理对零售户建立个体与产品之间的关联,实现由服务(群体)到产品(个体)的二级推荐。