论文部分内容阅读
国内电信业全业务竞争已经展开,中国移动在移动传统业务方面正面临着日益加剧的竞争压力,家庭和集团用户市场将是各大运营商最新角逐的市场以及开拓的新收入增长点。如何在海量用户群中准确识别出家庭用户、分析家庭用户的业务行为特征并对之进行有效的营销,是当前需要解决的话题。若不考虑建立挖掘模型,仅根据物理家庭用户和业务家庭用户的判别规则,我们可以提取的家庭用户仅有170万左右,约占总体客户的7%左右,离公司需要部署的家庭品牌、家庭产品线的目标客户数量相差甚远。因此应用数据挖掘的技术来辅助解决潜在家庭用户挖掘这一需求已迫在眉睫。本论文的研究为了解决仅仅使用简单数理统计所带来的预测准确率不高和不能覆盖所有用户群的问题,基于上海移动统一数据仓库的基础上,通过建立多通信方式下的交往圈归纳用户通信联系之间的特征,区别于普通的交往圈模型,利用语音交往圈叠加短信交往圈,并结合交往指数公式,在合并交往圈模型时加入权重计算,得到用户交往对的信息。根据已知的用户交往圈信息作为输入,建立了客户特征识别方法,用决策树算法对不同移动通信用户的行为特征归纳及分类,找出家庭用户的消费特征、行为规律以及各因素间的关联关系。运用这些关联关系,建立家庭用户识别模型,在通信用户中筛选出潜在家庭用户,对模型输出的家庭交往对,通过价值评估和交往对排序合并的方法来最终提取家庭用户。最后通过在全流量系统中提取家庭用户的上网搜索关键词,采用E-IDF方法,计算关键词向量与已有的各类家庭用户分类的关键词词典之间的匹配程度,提供一种符合移动通信企业需求的家庭用户细分标准,准确把握到客户实际的内容偏好,以便开展增值业务的精确营销。本论文所建立的模型可有效提高营销成功率,同时增强客户的粘性和培养忠诚度,也将为收入增长提供新的来源。通过实验测试结果,本论文识别出的家庭用户相比原来仅根据用户基本属性判断得到的用户,在准确性上有较大程度的提高。从上海移动正式环境运行情况来看,该识别模型能够与经营分析系统结合,对家庭用户进行全业务监控,从而有效利用此模型成果来进行精确化营销。从管理效益来看,由于及时构建了家庭用户识别模型,家庭市场拓展没有像农村市场那样开展全面的人工摸底工作,节约了大量的人力资源,成功地推进家庭用户精细化管理,减少监控资源浪费,提高企业管理效率。从成果社会效益来看,该模型能够更好地实现精确化营销,避免目标用户群重复选择导致的满意度下降,实现了家庭通信市场的可持续发展。