基于文本分类技术的微博平台潜在客户挖掘

被引量 : 0次 | 上传用户:waterxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博(Microblog)、Facebook和YouTube等社会化媒体的快速发展已经深刻地改变了企业与客户、客户与客户之间的沟通互动方式,在这种新兴媒体上,客户在产品或服务交易市场上发挥着空前主动的角色。社会化媒体具有强大的信息传播能力、互动性强、信息分享实时等特点,充分利用这些特点进行有效的社会化媒体营销能帮助企业改善品牌形象,提高品牌知名度,从而扩大其市场份额。微博的用户数量庞大、信息传播速度迅速、影响范围广泛,这使得微博营销成为企业社会化媒体营销中最为重要的一个环节,而潜在客户识别是开展精准微博营销的重要基础。如何有效地表示客户的特性是潜在客户挖掘最重要的基础问题,它对潜在客户挖掘效果具有决定性的作用。目前,国内外对微博平台潜在客户挖掘的研究尚少,相关的研究主要根据客户的人口统计信息和微博使用行为等方面抽取特征来刻画客户的特性,该类型方法的操作较为复杂;同时,由于对客户特性的描述特征还不够准确等问题导致其识别准确率偏低(最好的准确率为76%左右)。本研究认为客户的社会关系网的兴趣爱好信息对客户特性的描述具有重要意义,旨在通过微博平台探索客户的社会关系特性在潜在客户挖掘中的作用,提出融合客户及其微博好友自定义标签信息,从客户个人和社会特性两个方面生成客户特性描述文本,进而提出一种基于文本分类的微博平台潜在客户挖掘框架。大量的实验结果表明:本研究提出的客户特性描述方法能帮助潜在客户识别模型平均有86%左右的准确率;K最近邻(K Nearest Neighbors,KNN)分类、朴素贝叶斯(Naive Bayes,NB)分类、Rocchio分类、基于类别质心的分类方法(Centroid-based Classification,Centroid)和支持向量机分类(Support VectorMachines, SVM)等5种文本分类算法都获得较高准确率的潜在客户识别效果,验证了本研究所提出框架的有效性。在这5个分类器中,SVM取得了准确率最高的潜在客户识别性能,但其建模和决策分析较为耗时,而NB是在潜在客户识别性能和运行时间方面权衡的最好的分类算法,其次为Rocchio和Centroid。借助微博平台提供的丰富社会关系信息,融合客户的社会关系网的兴趣爱好信息来刻画客户的特性不仅为潜在客户挖掘提供一种新的视角和手段,同时也为客户细分、客户流失等经典客户关系管理问题的研究提供很好的参考。
其他文献
信息产业是21世纪经济发展的重要引擎,是各国抢占科技经济制高点的战略性产业。美国在信息技术研发应用等方面一直处于世界一流水平,信息产业是美国"新经济"的支柱。文章分析
分析哲学对黑格尔的批判包含着一个致命误解,即从经验事实和矛盾律出发反对黑格尔的辩证法。黑格尔的真理概念是作为哲学真理的有限性与无限性的统一,黑格尔认为,作为无限性
水是生命的源泉,是人类生存和社会发展的最基本物质保障。如今,淡水资源的短缺已成为制约社会发展的主要因素。除盐作为一种重要的水处理手段,能够适当缓解当前对淡水资源的供求
虽然集成电路自诞生以来,集成电路产业一直沿着摩尔定律这一被IT业奉为圭臬的定律发展至今,但随着物理极限的临近和集成电路产业的演化,未来集成电路产业发展将会出现新的变
农村劳动力转移作为资源重新配置的过程,不但受制于产业技术进步,也会影响产业技术进步。通过建立计量经济模型,实证分析1978—2011年三次产业技术进步与农村劳动力转移之间
目的:介绍农村社区康复的一种模式(惠州模式)。方法:广东省惠州市农村社区康复经过两年来的社会实践,已初步形成了组织管理网络、技术指导网络、工作服务网络,其主要工作特点
目前国际碳金融市场已基本形成,呈现出持续发展的态势,并日益成为推动低碳经济发展的重要力量。本文介绍了国际碳金融市场的产生及其市场结构,分析了当前碳金融市场的发展特
在中国传统道德规范中忠”文化占有很大比重,在不同时期“忠”被赋予不同的涵义.它是中国传统道德的核心价 值理念,更是连接人与国家、社会的精神纽带.在新时期, “忠”文化
家居专业卖场作为现代专业市场的一个重要组成部分,是二十世纪九十年代以来出现的一种新建筑类型。但有关这一建筑形式的系统理论研究还未出现,因此对这类建筑的理论研究迫在眉
2014年末,上海市高级人民法院副院长邹碧华的逝世震动了法律文化圈。司法精英,英年早逝,悼念之声频现报网,几天时间内各类媒体发表上千篇回忆文章,十几万人在网上发帖。《人