论文部分内容阅读
近年来随着大数据思维在各个行业领域的不断应用,数据的巨大价值逐步显现。各大企业竞相构建自己的大数据平台以汇集、挖掘和加工分析数据,促进业务向更科学、更高效、更智能方向发展。然而,由于企业之间业务和数据差别巨大,如何有效收集存量大数据、挖掘大数据价值是一个有挑战性的应用研究课题。本项目研发来源于某集团公司实际应用需求,围绕企业间大数据推荐引流模型与算法设计展开应用研究。系统在构建的大数据平台基础上,使用提出的标签分段算法进行用户画像,使用设计的特征标签提取方法进行商品目标人群画像,基于画像数据匹配进行企业间客户与商品的相互推荐。本文的主要研究内容有:(1)在k-means聚类算法的基础上,提出了一种粗略分段与精细分段相结合的标签分段算法RR-SEG。该算法对数据排序后进行分组计数,根据每段平均数量来顺序计算每段应该包含的数据边界,以实现不同分布数据的均匀分段,保证分段结果的客观准确。(2)设计了适合特征标签提取的应用方法。根据不同标签值的出现次数计算标准差变异系数,作为标签离散度的衡量指标,将变异系数超过阀值的标签作为特征标签。特征标签可以准确地反映出对商品购买影响较大的因素,是分析商品目标人群特点的重要方法。(3)设计实现了企业间推荐引流系统。系统在大数据体系架构下,基于用户画像与商品画像,将其它企业的用户标签与目标企业的商品目标人群标签进行匹配,将匹配的用户推荐给目标企业,实现企业间用户与商品的相互推荐。从总体上看,本文构建的企业大数据推荐引流系统可有效汇集各企业的会员及销售数据,通过对这些数据的深入分析,为各企业推荐满足其要求的潜在新会员及商品。系统运行结果表明,该系统可有效帮助企业进行客户拉新,提高转化率,提升企业业绩。