论文部分内容阅读
摘要 通过分析声讯充值业务的特点及其在业务管理上的特殊需求,提出通过数据挖掘建立用户信用度模型的方法。利用该模型对业务过程中的各种已经发生和潜在可能发生的各种用户消费行为进行分析,智能识别高值忠诚用户和恶意盗打用户,并对其提供差异化的充值服务,既有效防范电话盗打行为,又减少对高值用户的限制。
关键词 声讯 充值 数据挖掘
随着充值类业务逐步成为电信声讯业务的主要收入来源,各级运营商普遍加大了对充值类业务的扶植和推广力度。但因为固定电话在用户端设备管控上的天生缺陷,不可避免会出现盗打行为,给企业和用户造成损失,某种程度地制约了声讯充值业务的发展。为了减少损失,各地业务管理者被迫采用限次、限额等手段对用户的充值次数和充值额度进行控制。虽然该法取得了一定的防盗打的效果,但对正常用户的使用也造成了很大的约束和不便。如何在业务发展和防盗打两方面取得平衡,是摆在各地业务管理者面前的一道难题。
本文首先分析声讯充值业务的特点及其在业务管理上的特殊需求,在此基础上,提出通过数据挖掘建立用户信用度模型的方法,利用该模型对业务过程中的各种已经发生和潜在可能发生的各种用户消费行为进行分析,寻找高值用户和盗打用户群体的特征,锁定高风险地区和时段。最后设计开发基于上述方法的用户价值挖掘系统,并将该方法在企业中进行应用。
1 声讯充值业务概述
1.1 业务特点及管理要求
声讯充值业务相对于实物点卡充值和网银、支付宝的支付方式,具有如下特点:
(1)操作简单安全。用户直接在电话上按键操作即可完成充值,不必担心木马、病毒导致银行支付密码被盗。
(2)记账式。大部分固定电话均采用后付费方式支付费用,因此在使用声讯充值业务时,也只能使用记账方式扣取用户费用。即使是预付费电话,也因为与计费中心存在同步时间差,实际上还是采用记账方式。
(3)无需注册。除公话等外所有电信用户均可直接使用声讯充值,不需要事先注册,也不用记忆密码。
(4)直充。用户在电话上完成充值后,充值平台实时与产品供应商通信,实现了立即到帐,不用记忆卡号和密码。
针对声讯充值业务采用电话拨入热线号码的方式,由用户选择所需业务后,在用户电话账户上扣取相应的费用。这种使用方式,对声讯充值业务平台提出了特殊的管理要求:
(1)防范固定电话交接箱盗打的风险。由于固定电话在小区交接箱处容易被不法分子利用工具,直接接在交接箱处接入电话网络,冒充用户电话拨打声讯电话。
(2)防范主叫号码欺骗的风险。现在电信网络复杂,有不法分子可以利用特殊的软件伪造用户的电话号码进行呼入。
1.2 风险防范措施
针对声讯充值业务的特点,结合可见的业务管理风险,业务管理者通常会采取以下方法进行风险防范:
(1)充值额度控制。对每部电话每天、每月的累计充值金额设置上限。
(2)电话回拨认证。用户申请声讯充值业务后,系统再次回拨用户的电话以验明身份。
(3)用户密码认证。事先为所有用户设置随机密码,用户在使用充值业务时必须输入该密码,用户可以使用本机拨打客服热线获取密码。
(4)用户资料鉴权。用户在使用充值业务时必须提交机主的姓名、地址、身份证号码等关键信息,如果与系统登记相符,则可以使用充值业务。
上述方法中:方式(1)是最简单、使用最广泛的一种方式,因为不区分产品、不区分用户、不区分地区,上限往往设置成最低的额度,但最终导致业务发展受到极大制约;方式(2)是针对主机号码欺骗的,但不可单独使用,要求用户必须主动拨入一次,采用拨入加回拨的组合方式,增加了用户操作上的复杂度,也降低了成功率。方式(3)最大的问题是用户如何安全的获得密码,否则,任何不法分子都可以通过同样的手段获取密码,密码就形同虚设;方式(4)需要人工干预,因为固定电话往往是多人使用,在运营商的客户管理系统中登记的机主信息不一定是实际的使用者,此外用户提交的资料也许不够完整,需要人工甄别。
从上述分析可以看出,没有一种方式能够全面满足声讯充值业务的管理需要。为了既能有效控制风险,又能发挥声讯充值业务的优势,我们需要建立一个用户信用度模型,让信用度高的用户获得更大的额度,使用更加方便,而信用度低的用户获得更小的额度,受到更多的约束。
2 基于用户价值的数据挖掘
2.1 理论基础
常用的数据挖掘方法有回归、分类、聚类、关联等。其中回归方法主要是根据样本数据,建立一个函数,表示输入变量和输出变量的关系,从而能够根据其他的输入数据预测到对应的输出结果,例如根据历史的声讯充值数据,可以预测下个月可能的声讯充值业务收入。分类方法则是建立一个结构,使得不同的数据属于不同的类别,新的输入数据则可以按照该结构被分成其中的某个类别。例如根据历史的消费数据,将用户按价值分为中、高、低三类用户。聚类方法则是根据数据之间的相似性强弱,将其分为多个类别。例如根据历史消费数据,找出特征鲜明的几类不同消费行为。关联方法则是寻找各种数据变量之间的关系,建立变量之间的关联规则。例如根据声讯充值业务的历史消费数据,找到最多被同时购买的几种产品。
数据挖掘在电信行业也早有应用,例如用户价值分析、客户忠诚度分析、高危离网用户分析等。在声讯充值业务领域,同样可以采用上述数据挖掘方法,通过分析历史数据,建立模型,按照用户不同的信用度,采用不同的认证、控制方法,授予不同的信用额度。
2.2 建立用户价值模型
根据以上对理论基础的分析,建立声讯充值业务用户的价值模型并应用的方法,可以分为以下几个步骤:
(1)建立声讯充值业务数据仓库。数据来源于声讯系统的业务使用记录,字段包括时间、区域、电话号码、充值产品、充值金额、虚拟账户名。建立四个维度表(时间、区域、电话号码、充值产品)和一个事实表(充值金额、虚拟账户名);
(2)按月为单位统计最近一段时间内(例如6个月)每个电话号码的累计充值金额大小,并计算当月所有电话号码的平均充值金额; (3)将用户分为高值、中值、低值三个等级。其中,统计时段内连续每个月均有充值,且每月累计充值金额均大于当月平均充值金额20%以上的用户分为高值用户,统计时段内有一半以上的月份有充值,且每月累计充值金额介于当月平均充值金额上下20%以内的用户分为中值用户,剩余用户分为低值用户。
2.3 差别认证和额度控制
在建立好用户价值模型后,可以根据用户价值类别,采用不同的认证方式和额度授权:
(1)高值和中值用户均采用直接呼入方式进行认证,额度授权按照其历史最高月充值额分别上浮30%和10%;
(2)低值用户采用呼入+回呼方式进行认证,额度授权按照其历史最高月充值额上浮5%;
(3)新用户(首次充值用户)采用呼入+回呼方式进行认证,额度授权为允许的最低月充值额,并且辅以频次控制手段;
(4)为保护中高值用户的安全,在下次充值时提示其加强帐户安全,强制让用户先设置支付密码后才能继续使用。用户如果今后忘了密码,可以转接人工坐席,待话务员核对完身份后可以重新设置支付密码。
2.4 识别恶意盗打行为
通过前面的用户价值区分,可以有效地保护中高值用户,但低值用户还是存在恶意盗打行为,而且即使采用最严格的呼入+回呼也无法防止交接箱盗打行为,但这些行为存在一个共同的规律,即集中在一个时间内,采用一系列相似的号码向一系列相似的虚拟账号充值,因此对历史充值记录进行分析,可以找到恶意盗打行为的规律,然后可以采用相应的手段予以制止。下面描述了该方法的步骤:
(1)按时间段统计每个区域的每天总充值额;
(2)比较同一区域不同天之间的差额,找出差额突变的区域及日期;
(3)在该日期和区域的交易记录中扫描电话号码相似的交易记录,并提取总数或总金额超出设定值所对应的记录特征码,如*5577*;
(4)在该日期和区域的交易记录中扫描虚拟账户相似性,并提取总数或总金额超出设定值所对应的记录特征码,如*aabb*;
(5)后续充值操作中,如果电话号码或虚拟账户匹配到特征码后,系统拒绝进行操作并发送监控告警,同时临时冻结对应区域、号段的充值业务,防止盗打者再次操作。
2.5 分析产品相关性
通过分析历史交易记录,可以了解哪些产品之间存在相关性,即用户充完A产品后又会去充B产品。下面描述了如何基于关联产品分析,进行业务推广的方法和步骤:
(1)采用关联分析算法(如Apriori算法)找出同一时段内被同一用户充值的多个关联产品;
(2)在用户充值A产品时就可以有针对性的推出B产品的快速充值(不需要再次认证);
(3)推出A+B的充值产品优惠套装,向用户推荐。
3 案例研究
某电信公司因为电话盗打引起的投诉较多,遂将单部电话每日的充值额度降到很低,并且还对各个局向的总充值额度设了较低的限制。之后的实际运行过程中,盗打情况并未明显改善,反而正常用户的充值经常因为额度控制受限,极端情况是,用户一个月内连一次充值都不能成功。业务管理员决定采用基于用户价值的管理方法,在有关专家配合下,抽取了最近6个月的充值记录,并统计平均每用户月充值额,分别为:
然后,找出月充值额超出平均值20%的高值用户以及中、低值用户在将用户按价值分等级后,配以合适的认证方法和额度授信,实现了差别化的用户使用体验,在随后的几个月中,中高值用户的交易量提升了50%以上。
对于低值和新用户则进行最低的额度控制,并重点进行盗打行为分析识别,为加快扫描速度,先统计各个地区的交易金额,然后分别与本地区上一时期的交易金额对比,按金额增长率和绝对值大小进行排序,在实际运行过程中,发现了以下3个地区的交易量突变:
在对3个地区进行电话号码、虚拟账号相似性扫描后,发现前2个地区属于正常业务增长,而第3个地区出现了很多帐户相似的记录以及电话相似的记录:
根据特征码进行详细记录提取后(如图1),证实的确为盗打行为,因为处理及时,避免了盗打行为继续扩散。
4 开发用户价值挖掘系统
为了降低在实施过程中对专家知识和经验的依赖,基于上述方法,构建了如图2所示的声讯用户价值挖掘系统,并开发了相应的软件系统。该软件系统的开发,极大地降低了所提出方法的计算量以及对人员的专业知识要求,使得本文方法在企业具有了可用性。
5 结语
本文分析了声讯充值业务管理的特殊需求,提出了基于用户价值的数据挖掘方法。案例分析表明该方法实用性、可操作性很强,对企业的基础数据没有要求,适应性强。建立了声讯用户价值挖掘系统的结构,并开发了相应的支撑软件,从而进一步降低了该方法对实施人员的专业知识的要求,提高了方法的实用性。
参 考 文 献
[1] 夏火松. 数据仓库与数据挖掘技术(第二版). 北京:科学出版社, 2009
[2] Wayland R E, Cole P M .邱振儒译. 客户关系联接技术. 商业周刊出版股份有限公司,2001
[3] W.H. Inmon. 王志海等译. 数据仓库(原书第4版). 北京:机械工业出版社,2006
[4] 卜小明. 数据仓库技术与未来电信市场竞争. 现代电信科技,1998;(11)
[5] 孙宏才,田平,王莲芬. 网络层次分析法与决策科学. 北京;国防工业出版社,2011
关键词 声讯 充值 数据挖掘
随着充值类业务逐步成为电信声讯业务的主要收入来源,各级运营商普遍加大了对充值类业务的扶植和推广力度。但因为固定电话在用户端设备管控上的天生缺陷,不可避免会出现盗打行为,给企业和用户造成损失,某种程度地制约了声讯充值业务的发展。为了减少损失,各地业务管理者被迫采用限次、限额等手段对用户的充值次数和充值额度进行控制。虽然该法取得了一定的防盗打的效果,但对正常用户的使用也造成了很大的约束和不便。如何在业务发展和防盗打两方面取得平衡,是摆在各地业务管理者面前的一道难题。
本文首先分析声讯充值业务的特点及其在业务管理上的特殊需求,在此基础上,提出通过数据挖掘建立用户信用度模型的方法,利用该模型对业务过程中的各种已经发生和潜在可能发生的各种用户消费行为进行分析,寻找高值用户和盗打用户群体的特征,锁定高风险地区和时段。最后设计开发基于上述方法的用户价值挖掘系统,并将该方法在企业中进行应用。
1 声讯充值业务概述
1.1 业务特点及管理要求
声讯充值业务相对于实物点卡充值和网银、支付宝的支付方式,具有如下特点:
(1)操作简单安全。用户直接在电话上按键操作即可完成充值,不必担心木马、病毒导致银行支付密码被盗。
(2)记账式。大部分固定电话均采用后付费方式支付费用,因此在使用声讯充值业务时,也只能使用记账方式扣取用户费用。即使是预付费电话,也因为与计费中心存在同步时间差,实际上还是采用记账方式。
(3)无需注册。除公话等外所有电信用户均可直接使用声讯充值,不需要事先注册,也不用记忆密码。
(4)直充。用户在电话上完成充值后,充值平台实时与产品供应商通信,实现了立即到帐,不用记忆卡号和密码。
针对声讯充值业务采用电话拨入热线号码的方式,由用户选择所需业务后,在用户电话账户上扣取相应的费用。这种使用方式,对声讯充值业务平台提出了特殊的管理要求:
(1)防范固定电话交接箱盗打的风险。由于固定电话在小区交接箱处容易被不法分子利用工具,直接接在交接箱处接入电话网络,冒充用户电话拨打声讯电话。
(2)防范主叫号码欺骗的风险。现在电信网络复杂,有不法分子可以利用特殊的软件伪造用户的电话号码进行呼入。
1.2 风险防范措施
针对声讯充值业务的特点,结合可见的业务管理风险,业务管理者通常会采取以下方法进行风险防范:
(1)充值额度控制。对每部电话每天、每月的累计充值金额设置上限。
(2)电话回拨认证。用户申请声讯充值业务后,系统再次回拨用户的电话以验明身份。
(3)用户密码认证。事先为所有用户设置随机密码,用户在使用充值业务时必须输入该密码,用户可以使用本机拨打客服热线获取密码。
(4)用户资料鉴权。用户在使用充值业务时必须提交机主的姓名、地址、身份证号码等关键信息,如果与系统登记相符,则可以使用充值业务。
上述方法中:方式(1)是最简单、使用最广泛的一种方式,因为不区分产品、不区分用户、不区分地区,上限往往设置成最低的额度,但最终导致业务发展受到极大制约;方式(2)是针对主机号码欺骗的,但不可单独使用,要求用户必须主动拨入一次,采用拨入加回拨的组合方式,增加了用户操作上的复杂度,也降低了成功率。方式(3)最大的问题是用户如何安全的获得密码,否则,任何不法分子都可以通过同样的手段获取密码,密码就形同虚设;方式(4)需要人工干预,因为固定电话往往是多人使用,在运营商的客户管理系统中登记的机主信息不一定是实际的使用者,此外用户提交的资料也许不够完整,需要人工甄别。
从上述分析可以看出,没有一种方式能够全面满足声讯充值业务的管理需要。为了既能有效控制风险,又能发挥声讯充值业务的优势,我们需要建立一个用户信用度模型,让信用度高的用户获得更大的额度,使用更加方便,而信用度低的用户获得更小的额度,受到更多的约束。
2 基于用户价值的数据挖掘
2.1 理论基础
常用的数据挖掘方法有回归、分类、聚类、关联等。其中回归方法主要是根据样本数据,建立一个函数,表示输入变量和输出变量的关系,从而能够根据其他的输入数据预测到对应的输出结果,例如根据历史的声讯充值数据,可以预测下个月可能的声讯充值业务收入。分类方法则是建立一个结构,使得不同的数据属于不同的类别,新的输入数据则可以按照该结构被分成其中的某个类别。例如根据历史的消费数据,将用户按价值分为中、高、低三类用户。聚类方法则是根据数据之间的相似性强弱,将其分为多个类别。例如根据历史消费数据,找出特征鲜明的几类不同消费行为。关联方法则是寻找各种数据变量之间的关系,建立变量之间的关联规则。例如根据声讯充值业务的历史消费数据,找到最多被同时购买的几种产品。
数据挖掘在电信行业也早有应用,例如用户价值分析、客户忠诚度分析、高危离网用户分析等。在声讯充值业务领域,同样可以采用上述数据挖掘方法,通过分析历史数据,建立模型,按照用户不同的信用度,采用不同的认证、控制方法,授予不同的信用额度。
2.2 建立用户价值模型
根据以上对理论基础的分析,建立声讯充值业务用户的价值模型并应用的方法,可以分为以下几个步骤:
(1)建立声讯充值业务数据仓库。数据来源于声讯系统的业务使用记录,字段包括时间、区域、电话号码、充值产品、充值金额、虚拟账户名。建立四个维度表(时间、区域、电话号码、充值产品)和一个事实表(充值金额、虚拟账户名);
(2)按月为单位统计最近一段时间内(例如6个月)每个电话号码的累计充值金额大小,并计算当月所有电话号码的平均充值金额; (3)将用户分为高值、中值、低值三个等级。其中,统计时段内连续每个月均有充值,且每月累计充值金额均大于当月平均充值金额20%以上的用户分为高值用户,统计时段内有一半以上的月份有充值,且每月累计充值金额介于当月平均充值金额上下20%以内的用户分为中值用户,剩余用户分为低值用户。
2.3 差别认证和额度控制
在建立好用户价值模型后,可以根据用户价值类别,采用不同的认证方式和额度授权:
(1)高值和中值用户均采用直接呼入方式进行认证,额度授权按照其历史最高月充值额分别上浮30%和10%;
(2)低值用户采用呼入+回呼方式进行认证,额度授权按照其历史最高月充值额上浮5%;
(3)新用户(首次充值用户)采用呼入+回呼方式进行认证,额度授权为允许的最低月充值额,并且辅以频次控制手段;
(4)为保护中高值用户的安全,在下次充值时提示其加强帐户安全,强制让用户先设置支付密码后才能继续使用。用户如果今后忘了密码,可以转接人工坐席,待话务员核对完身份后可以重新设置支付密码。
2.4 识别恶意盗打行为
通过前面的用户价值区分,可以有效地保护中高值用户,但低值用户还是存在恶意盗打行为,而且即使采用最严格的呼入+回呼也无法防止交接箱盗打行为,但这些行为存在一个共同的规律,即集中在一个时间内,采用一系列相似的号码向一系列相似的虚拟账号充值,因此对历史充值记录进行分析,可以找到恶意盗打行为的规律,然后可以采用相应的手段予以制止。下面描述了该方法的步骤:
(1)按时间段统计每个区域的每天总充值额;
(2)比较同一区域不同天之间的差额,找出差额突变的区域及日期;
(3)在该日期和区域的交易记录中扫描电话号码相似的交易记录,并提取总数或总金额超出设定值所对应的记录特征码,如*5577*;
(4)在该日期和区域的交易记录中扫描虚拟账户相似性,并提取总数或总金额超出设定值所对应的记录特征码,如*aabb*;
(5)后续充值操作中,如果电话号码或虚拟账户匹配到特征码后,系统拒绝进行操作并发送监控告警,同时临时冻结对应区域、号段的充值业务,防止盗打者再次操作。
2.5 分析产品相关性
通过分析历史交易记录,可以了解哪些产品之间存在相关性,即用户充完A产品后又会去充B产品。下面描述了如何基于关联产品分析,进行业务推广的方法和步骤:
(1)采用关联分析算法(如Apriori算法)找出同一时段内被同一用户充值的多个关联产品;
(2)在用户充值A产品时就可以有针对性的推出B产品的快速充值(不需要再次认证);
(3)推出A+B的充值产品优惠套装,向用户推荐。
3 案例研究
某电信公司因为电话盗打引起的投诉较多,遂将单部电话每日的充值额度降到很低,并且还对各个局向的总充值额度设了较低的限制。之后的实际运行过程中,盗打情况并未明显改善,反而正常用户的充值经常因为额度控制受限,极端情况是,用户一个月内连一次充值都不能成功。业务管理员决定采用基于用户价值的管理方法,在有关专家配合下,抽取了最近6个月的充值记录,并统计平均每用户月充值额,分别为:
然后,找出月充值额超出平均值20%的高值用户以及中、低值用户在将用户按价值分等级后,配以合适的认证方法和额度授信,实现了差别化的用户使用体验,在随后的几个月中,中高值用户的交易量提升了50%以上。
对于低值和新用户则进行最低的额度控制,并重点进行盗打行为分析识别,为加快扫描速度,先统计各个地区的交易金额,然后分别与本地区上一时期的交易金额对比,按金额增长率和绝对值大小进行排序,在实际运行过程中,发现了以下3个地区的交易量突变:
在对3个地区进行电话号码、虚拟账号相似性扫描后,发现前2个地区属于正常业务增长,而第3个地区出现了很多帐户相似的记录以及电话相似的记录:
根据特征码进行详细记录提取后(如图1),证实的确为盗打行为,因为处理及时,避免了盗打行为继续扩散。
4 开发用户价值挖掘系统
为了降低在实施过程中对专家知识和经验的依赖,基于上述方法,构建了如图2所示的声讯用户价值挖掘系统,并开发了相应的软件系统。该软件系统的开发,极大地降低了所提出方法的计算量以及对人员的专业知识要求,使得本文方法在企业具有了可用性。
5 结语
本文分析了声讯充值业务管理的特殊需求,提出了基于用户价值的数据挖掘方法。案例分析表明该方法实用性、可操作性很强,对企业的基础数据没有要求,适应性强。建立了声讯用户价值挖掘系统的结构,并开发了相应的支撑软件,从而进一步降低了该方法对实施人员的专业知识的要求,提高了方法的实用性。
参 考 文 献
[1] 夏火松. 数据仓库与数据挖掘技术(第二版). 北京:科学出版社, 2009
[2] Wayland R E, Cole P M .邱振儒译. 客户关系联接技术. 商业周刊出版股份有限公司,2001
[3] W.H. Inmon. 王志海等译. 数据仓库(原书第4版). 北京:机械工业出版社,2006
[4] 卜小明. 数据仓库技术与未来电信市场竞争. 现代电信科技,1998;(11)
[5] 孙宏才,田平,王莲芬. 网络层次分析法与决策科学. 北京;国防工业出版社,2011