论文部分内容阅读
微博(Microblog)、Facebook和YouTube等社会化媒体的快速发展已经深刻地改变了企业与客户、客户与客户之间的沟通互动方式,在这种新兴媒体上,客户在产品或服务交易市场上发挥着空前主动的角色。社会化媒体具有强大的信息传播能力、互动性强、信息分享实时等特点,充分利用这些特点进行有效的社会化媒体营销能帮助企业改善品牌形象,提高品牌知名度,从而扩大其市场份额。微博的用户数量庞大、信息传播速度迅速、影响范围广泛,这使得微博营销成为企业社会化媒体营销中最为重要的一个环节,而潜在客户识别是开展精准微博营销的重要基础。如何有效地表示客户的特性是潜在客户挖掘最重要的基础问题,它对潜在客户挖掘效果具有决定性的作用。目前,国内外对微博平台潜在客户挖掘的研究尚少,相关的研究主要根据客户的人口统计信息和微博使用行为等方面抽取特征来刻画客户的特性,该类型方法的操作较为复杂;同时,由于对客户特性的描述特征还不够准确等问题导致其识别准确率偏低(最好的准确率为76%左右)。本研究认为客户的社会关系网的兴趣爱好信息对客户特性的描述具有重要意义,旨在通过微博平台探索客户的社会关系特性在潜在客户挖掘中的作用,提出融合客户及其微博好友自定义标签信息,从客户个人和社会特性两个方面生成客户特性描述文本,进而提出一种基于文本分类的微博平台潜在客户挖掘框架。大量的实验结果表明:本研究提出的客户特性描述方法能帮助潜在客户识别模型平均有86%左右的准确率;K最近邻(K Nearest Neighbors,KNN)分类、朴素贝叶斯(Naive Bayes,NB)分类、Rocchio分类、基于类别质心的分类方法(Centroid-based Classification,Centroid)和支持向量机分类(Support VectorMachines, SVM)等5种文本分类算法都获得较高准确率的潜在客户识别效果,验证了本研究所提出框架的有效性。在这5个分类器中,SVM取得了准确率最高的潜在客户识别性能,但其建模和决策分析较为耗时,而NB是在潜在客户识别性能和运行时间方面权衡的最好的分类算法,其次为Rocchio和Centroid。借助微博平台提供的丰富社会关系信息,融合客户的社会关系网的兴趣爱好信息来刻画客户的特性不仅为潜在客户挖掘提供一种新的视角和手段,同时也为客户细分、客户流失等经典客户关系管理问题的研究提供很好的参考。