论文部分内容阅读
摘要:[目的/意义]随着知识管理相关理论的发展,各相关工业部门特别是完成了信息化的工业部门也面临着越来越紧迫的知识化转型。在知识化转型过程中除知识管理的相关理论外,也需要提炼出知识管理相关工具体系。[方法/过程]主要研究知识管理相关工具在电力行业市场营销领域中的应用,从电力业务人员日常接触的数据中萃取影响缴费用户的特征因素,并形成与用户缴费欠费习惯相关的关键知识,为业务人员未来工作进行指导。首先,从电力系统中采集甘肃省内近10万户的用电及缴费数据,并整理出由问卷调查获得的数据;其次,采用主成分分析及回归方法构造用户按时缴费模型;最后,根据模型分析获得促使用户按时缴费的因素,提出针对性的营销策略,以降低电费拖欠率并降低电费回收成本。[结果/结论]通过分析,找到用户履约能力、客户满意度及征缴频率等关键因素,较好地实现电力知识化转型。
关键词:电力系统知识化 数据智能 电力营销 用户特征
分类号:F426.61
DOI:10.13266/j.issn.2095-5472.2020.018
引用格式:江元, 杨波, 王麒, 等. 基于用户特征的电费回收分析及策略: 电力知识化转型工程实践[J/OL]. 知识管理论坛, 2020, 5(3): 200-208[引用日期]. http://www.kmf.ac.cn/p/213/.
1 引言
電力是经济社会发展的支柱能源,随着科技的发展,人类生活和生产的方方面面都已经离不开电力[1]。电力系统是相关工业部门中较早完成信息化的行业,同时也是亟待进一步进行知识化改造的行业。以电力市场营销为例,虽然电力信息化系统中沉淀了大量多维度的客户数据,包括用电量数据、缴费账单、投诉维修记录、用户基本信息、缴费渠道记录等。然而这些多维度的数据仅仅是记录在信息系统中,却没有被充分利用。对于用户用电特征的分析、欠费回收的策略等工作主要依赖一线人员的主观经验,即隐性知识来完成。业务人员的隐性知识是长期与用户沟通及观测用户用电数据获得的。从业多年的业务员可根据自身的经验从用户的用电量情况判断用户是否存在偷电、恶意拖欠电费等行为,并根据用户的账单、投诉反馈记录等相关信息判断电费回收的难易度,从而采取相应的催收策略,而新员工由于缺乏经验很难接手这一工作。因此,电费的清缴工作效率低、难度大。若能有效利用系统中积累的用户数据,从数据中获得用户的用电需求,缴费习惯,履约能力等特征将为业务人员的催缴策略提供帮助,这将大大节约电力企业的人力物力,降低电费回收的成本。
根据国网甘肃省电力有限公司提供的缴费信息可以发现,实际的平均电价远小于理论上的电价,也就是说回收的电费并不能保证100%,可以看出电力公司面临的用户拖欠费的情况是比较严峻的。拖欠费现象屡见不鲜[2],每年电网公司因为用户的不正当行为所造成的经济损失达200亿元,且年年呈现上升的趋势[3],对于电费回收的研究已经迫在眉睫。申纪和吟李[4]认为目前国内电力用户拖欠费问题严重的原因主要有3个方面:①用户的电力法制观念比较淡薄,更加重视效益但是不重视法制;②企业利益驱动,通过拖欠国家电费企业可以保留更多的流动资金,借此提高企业的效益;③一些工业用户由于受到地方保护,助长其恶意拖欠电费的行为。黄文思等[5]通过分析客户缴费行为历史数据,挖掘隐藏的拖欠费风险规律,识别客户风险,将客户特征分为基本信息、账单信息、缴费情况3个部分。据此,笔者更进一步针对用户的态度及行为特征,将影响因素分为缴费能力、缴费意愿、缴费习惯3个方面展开研究,以确定电费回收策略的改进方法。
2 研究设计
本文研究主要分为3个阶段,各阶段依次递进。首先,为明确影响用户缴费的主要因素,并减少数据分析算法数据处理的复杂度和提高效率,在第3节中通过用户访谈的主观方法和文献调研的客观方法分析筛选影响用户缴费的因素,为调查问卷的设计提供依据。通过参考现有文献并结合甘肃省的业务特点,综合得到用户收入、用电量、电价、集体人口数、地区、行为认识、供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度、缴费渠道12个指标变量与按时缴费这一因变量。其次,采集数据并利用主成分分析在12个指标变量基础上获得缴费能力、缴费意愿及缴费习惯3个维度的用户特征,利用回归分析方法进行知识挖掘,获取用户特征对按时缴费行为的影响。最后,根据知识挖掘结果评估用户拖欠费率,根据用户特征制定相应的电费回收策略。
数据源分为两部分,第一部分为从电力系统中采集的甘肃省近10万户的用电及缴费数据,第二部分为问卷调查获得的数据。由系统采集的用电量及缴费数据获得用户月用电量、缴费积极、按时缴费、渠道类型等指标数据,渠道类型分为4种:收费人员上门收取、去网点柜台缴纳、银行卡代扣及网上三方平台缴纳;由问卷调查获得用户的家庭经济情况、居民用户满意度、欠费危害认识度等方面的信息数据,具体指标及其阐释将在下文进行介绍。
3 用户缴费影响因素分析
3.1 用户深度访谈
用户深度访谈阶段,主要是通过座谈获取潜在隐性知识中可能的客观要素。为确定初始的影响因素,笔者选择几十名来自不同地区的具有代表性的用户进行一次深度访谈。利用成型的问卷并辅以非结构性的询问,将影响他们按时缴纳电费的原因总结为以下几点:缺乏对电力信息的了解、没有合理的电费缴纳周期、不具备按时缴费的意识、地区/缴费渠道的限制、对供电/电压/服务等的不满、欠费后果过于轻微等。
有代表性的用户访谈记录如下:
用户a家在农村,电费是通过所在农村的合作社进行缴纳,尽管用电量较小,但依然是每月一次按时缴纳。但用户反映该地区的供电存在许多问题,比如电压不稳、易停电、复电难,因此用户a明确表示对于缴纳电费的积极性不高。 用户b的家里共有6口人,居住在农村。其子女目前在工厂上班,工作十分忙碌,只有节假日才会回家,平时无暇顾及家里。用户b的年龄比较大,对于手机的操作不太擅长,曾经出现过忘记缴纳电费而被断电的情况。
用户c居住在城镇里,一楼出租给他人开店,所以出现一户两表的情形,电费按比例分摊,缴纳电费的方式为银行卡代扣,但经常由于租户充钱不及时而被催缴电费。
对访谈用户拖欠电费的原因进行归类分析,详见表1及图1:
3.2 文献调研
关于电费缴费的影响因素,学者们进行了相应研究,如张?等对电网营销业务管理系统中用户电费收缴数据进行清洗与转换后,生成12个重要的建模变量:停电状态、用户每月电费通知方式、城乡类别、临时用电标志、费用结算方式、用户分类、收费次数、用电类别、高能行业分类、每月应收金额、每月总电量、每月实收金额[6]。李宗隆等则是用主成分分析的方法提取7个相关指标:用电量变化、平均拖欠费金额、平均拖欠费金额比例、累计拖欠费次数、平均催费次数、应收违约金和账户余额满足率[7]。王彬等研究了由于供电满意度导致的电费回收问题,其中包含供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度5个变量[8]。对于影响因素的研究有必要选择一个合适的建模方法,国内的现有研究对于各种不同的数据分析与挖掘方法均有尝试,具体包括层次分析法[9]、逻辑回归法[10]、随机森林法[11]及大数据分析[12]等。针对电费回收策略问题,国内专家学者进行了深入研究。夏国明和谢华对电费回收现实问题开展全面叙述,指出需要使用信息化方式协助电费回收,使用灵活自助的结算模式提高服务能力[13]。张春城指出在现实运作过程中需要使用事前预防、事中控制、事后补救的全过程防范方式方法处理电费回收问题[14]。杜建实认为在电费预收制度的前提下,倡导实施“购电制”,避免电费回收问题[15]。解召辉研究了利用政府部门的约束性和强制力来督促欠费用户及时缴清电费的策略[16]。上述文献提出的电费回收策略成本较高,需要投入大量的人力物力配合电费回收策略的执行,而且策略是面向全体用户的,单一化的。笔者的电费回收策略是基于用户特征,更具“个性化”,与上述研究成果相比具有“降本增效”的特点。
笔者参考电力公司对客户拖欠费的定义,收到缴费通知7天内缴清电费为按时缴纳电费,超过7天但不超过一个月内缴清电费为拖费,超过一个月为缴清电费为欠费,其中拖费和欠費对电力公司造成的损失大小相仿。可以认为居民用户拖欠电费行为发生的次数越多,居民完成缴费行为与收到缴费通知间的时间间隔越大,未来发生拖欠费行为的风险就越高。因此综合得到用户收入、用电量、电价、集体人口数、地区、行为认识、供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度、缴费渠道12个指标变量与按时缴费这一因变量。
3.3 预调研与因素确认
根据上文提出的13个变量进行预调研,并将所得到的数据进行标准化。通过数据分析发现,电价及电价满意度对于用户按时缴费的影响均不显著,同时来自不同地区的用户之间的缴费情况并没有显著差异。在用户用电满意度方面,对于电能质量的感知更多在于停电的频率与复电的速度,实际上根源是供电稳定满意度,因此电能质量满意度这一变量重复。综上,删除了地区、电能质量满意度、电价、电价满意度4个指标。结合前文的文献整理,最终得到11个指标变量与1个因变量,如表2所示:
4 实证分析
利用国网甘肃省电力有限公司提供的用户用电信息,笔者针对用户缴费这一行为进行实证研究,并预期获取相关隐性知识的潜在因素。
4.1 问卷调研
通过问卷对用电用户的家庭经济情况、居民用户满意度、欠费危害认识度进行调查。家庭经济情况中包括每月收入;居民用户满意度分为供电满意、服务满意、电费信任、缴费方便、渠道满意;欠费危害认识度分为后果认知和行为认知,行为认知指居民用户对于逾期缴纳电费、欠费等行为的看法,后果认知指居民用户对逾期缴纳电费、欠费等行为造成的后果的看法。同时,调研中设置的用户基本信息包含性别。
本次问卷通过社交媒体平台发放,最终获得问卷334份。性别比例上,女性占54.19%,男性45.81%,基本满足男女一比一的比例。来源地区共涉及28个省或直辖市,认为本次问卷回收的地区偏向较小。
对本次回收所得334份问卷进行有效问卷的筛选,删除选择不了解有关用电情况、填写时间小于34秒、前后出现明显逻辑矛盾(如按时缴费获得高分而缴费积极获得低分)、选项完全一样或大部分一样的问卷,最后总计删除45份,保留有效问卷289份,问卷有效率为86.5%。
4.2 信度检验
信度即可靠性,它是指采用同样的方法对同一对象重复测量所得结果的一致性程度。目前最常用的信度系数是Cronbach α信度系数,也就是α信度系数法,其公式为:
通常来讲,数据的信度系数在0.7-0.8之间可以接受,利用SPSS检验数据的信度得到其信度系数为0.752,大于0.7,在可以接受的范围内。
4.3 相关分析
Pearson相关系数可以用来衡量变量之间的线性关系。可以发现,除按时缴费和用电量以及电费信任以外8个自变量在0.05水平上显著相关;每月收入只和按时缴费在0.05水平上显著相关;用电量和所有变量均不在0.05水平上显著相关;缴费积极和按时缴费在0.05水平上显著相关;剩余的供电满意、服务满意、电费信任、缴费便利、渠道满意、行为认知、结果认知这7个变量,每两个变量间都在0.05水平上显著相关。由于用电量和其他所有变量之间都不存在显著相关的关系,可以认为用电量对于因变量按时缴费没有显著的影响,故删去。
关键词:电力系统知识化 数据智能 电力营销 用户特征
分类号:F426.61
DOI:10.13266/j.issn.2095-5472.2020.018
引用格式:江元, 杨波, 王麒, 等. 基于用户特征的电费回收分析及策略: 电力知识化转型工程实践[J/OL]. 知识管理论坛, 2020, 5(3): 200-208[引用日期]. http://www.kmf.ac.cn/p/213/.
1 引言
電力是经济社会发展的支柱能源,随着科技的发展,人类生活和生产的方方面面都已经离不开电力[1]。电力系统是相关工业部门中较早完成信息化的行业,同时也是亟待进一步进行知识化改造的行业。以电力市场营销为例,虽然电力信息化系统中沉淀了大量多维度的客户数据,包括用电量数据、缴费账单、投诉维修记录、用户基本信息、缴费渠道记录等。然而这些多维度的数据仅仅是记录在信息系统中,却没有被充分利用。对于用户用电特征的分析、欠费回收的策略等工作主要依赖一线人员的主观经验,即隐性知识来完成。业务人员的隐性知识是长期与用户沟通及观测用户用电数据获得的。从业多年的业务员可根据自身的经验从用户的用电量情况判断用户是否存在偷电、恶意拖欠电费等行为,并根据用户的账单、投诉反馈记录等相关信息判断电费回收的难易度,从而采取相应的催收策略,而新员工由于缺乏经验很难接手这一工作。因此,电费的清缴工作效率低、难度大。若能有效利用系统中积累的用户数据,从数据中获得用户的用电需求,缴费习惯,履约能力等特征将为业务人员的催缴策略提供帮助,这将大大节约电力企业的人力物力,降低电费回收的成本。
根据国网甘肃省电力有限公司提供的缴费信息可以发现,实际的平均电价远小于理论上的电价,也就是说回收的电费并不能保证100%,可以看出电力公司面临的用户拖欠费的情况是比较严峻的。拖欠费现象屡见不鲜[2],每年电网公司因为用户的不正当行为所造成的经济损失达200亿元,且年年呈现上升的趋势[3],对于电费回收的研究已经迫在眉睫。申纪和吟李[4]认为目前国内电力用户拖欠费问题严重的原因主要有3个方面:①用户的电力法制观念比较淡薄,更加重视效益但是不重视法制;②企业利益驱动,通过拖欠国家电费企业可以保留更多的流动资金,借此提高企业的效益;③一些工业用户由于受到地方保护,助长其恶意拖欠电费的行为。黄文思等[5]通过分析客户缴费行为历史数据,挖掘隐藏的拖欠费风险规律,识别客户风险,将客户特征分为基本信息、账单信息、缴费情况3个部分。据此,笔者更进一步针对用户的态度及行为特征,将影响因素分为缴费能力、缴费意愿、缴费习惯3个方面展开研究,以确定电费回收策略的改进方法。
2 研究设计
本文研究主要分为3个阶段,各阶段依次递进。首先,为明确影响用户缴费的主要因素,并减少数据分析算法数据处理的复杂度和提高效率,在第3节中通过用户访谈的主观方法和文献调研的客观方法分析筛选影响用户缴费的因素,为调查问卷的设计提供依据。通过参考现有文献并结合甘肃省的业务特点,综合得到用户收入、用电量、电价、集体人口数、地区、行为认识、供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度、缴费渠道12个指标变量与按时缴费这一因变量。其次,采集数据并利用主成分分析在12个指标变量基础上获得缴费能力、缴费意愿及缴费习惯3个维度的用户特征,利用回归分析方法进行知识挖掘,获取用户特征对按时缴费行为的影响。最后,根据知识挖掘结果评估用户拖欠费率,根据用户特征制定相应的电费回收策略。
数据源分为两部分,第一部分为从电力系统中采集的甘肃省近10万户的用电及缴费数据,第二部分为问卷调查获得的数据。由系统采集的用电量及缴费数据获得用户月用电量、缴费积极、按时缴费、渠道类型等指标数据,渠道类型分为4种:收费人员上门收取、去网点柜台缴纳、银行卡代扣及网上三方平台缴纳;由问卷调查获得用户的家庭经济情况、居民用户满意度、欠费危害认识度等方面的信息数据,具体指标及其阐释将在下文进行介绍。
3 用户缴费影响因素分析
3.1 用户深度访谈
用户深度访谈阶段,主要是通过座谈获取潜在隐性知识中可能的客观要素。为确定初始的影响因素,笔者选择几十名来自不同地区的具有代表性的用户进行一次深度访谈。利用成型的问卷并辅以非结构性的询问,将影响他们按时缴纳电费的原因总结为以下几点:缺乏对电力信息的了解、没有合理的电费缴纳周期、不具备按时缴费的意识、地区/缴费渠道的限制、对供电/电压/服务等的不满、欠费后果过于轻微等。
有代表性的用户访谈记录如下:
用户a家在农村,电费是通过所在农村的合作社进行缴纳,尽管用电量较小,但依然是每月一次按时缴纳。但用户反映该地区的供电存在许多问题,比如电压不稳、易停电、复电难,因此用户a明确表示对于缴纳电费的积极性不高。 用户b的家里共有6口人,居住在农村。其子女目前在工厂上班,工作十分忙碌,只有节假日才会回家,平时无暇顾及家里。用户b的年龄比较大,对于手机的操作不太擅长,曾经出现过忘记缴纳电费而被断电的情况。
用户c居住在城镇里,一楼出租给他人开店,所以出现一户两表的情形,电费按比例分摊,缴纳电费的方式为银行卡代扣,但经常由于租户充钱不及时而被催缴电费。
对访谈用户拖欠电费的原因进行归类分析,详见表1及图1:
3.2 文献调研
关于电费缴费的影响因素,学者们进行了相应研究,如张?等对电网营销业务管理系统中用户电费收缴数据进行清洗与转换后,生成12个重要的建模变量:停电状态、用户每月电费通知方式、城乡类别、临时用电标志、费用结算方式、用户分类、收费次数、用电类别、高能行业分类、每月应收金额、每月总电量、每月实收金额[6]。李宗隆等则是用主成分分析的方法提取7个相关指标:用电量变化、平均拖欠费金额、平均拖欠费金额比例、累计拖欠费次数、平均催费次数、应收违约金和账户余额满足率[7]。王彬等研究了由于供电满意度导致的电费回收问题,其中包含供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度5个变量[8]。对于影响因素的研究有必要选择一个合适的建模方法,国内的现有研究对于各种不同的数据分析与挖掘方法均有尝试,具体包括层次分析法[9]、逻辑回归法[10]、随机森林法[11]及大数据分析[12]等。针对电费回收策略问题,国内专家学者进行了深入研究。夏国明和谢华对电费回收现实问题开展全面叙述,指出需要使用信息化方式协助电费回收,使用灵活自助的结算模式提高服务能力[13]。张春城指出在现实运作过程中需要使用事前预防、事中控制、事后补救的全过程防范方式方法处理电费回收问题[14]。杜建实认为在电费预收制度的前提下,倡导实施“购电制”,避免电费回收问题[15]。解召辉研究了利用政府部门的约束性和强制力来督促欠费用户及时缴清电费的策略[16]。上述文献提出的电费回收策略成本较高,需要投入大量的人力物力配合电费回收策略的执行,而且策略是面向全体用户的,单一化的。笔者的电费回收策略是基于用户特征,更具“个性化”,与上述研究成果相比具有“降本增效”的特点。
笔者参考电力公司对客户拖欠费的定义,收到缴费通知7天内缴清电费为按时缴纳电费,超过7天但不超过一个月内缴清电费为拖费,超过一个月为缴清电费为欠费,其中拖费和欠費对电力公司造成的损失大小相仿。可以认为居民用户拖欠电费行为发生的次数越多,居民完成缴费行为与收到缴费通知间的时间间隔越大,未来发生拖欠费行为的风险就越高。因此综合得到用户收入、用电量、电价、集体人口数、地区、行为认识、供电稳定满意度、电能质量满意度、服务满意度、电费认可度、电价满意度、缴费渠道12个指标变量与按时缴费这一因变量。
3.3 预调研与因素确认
根据上文提出的13个变量进行预调研,并将所得到的数据进行标准化。通过数据分析发现,电价及电价满意度对于用户按时缴费的影响均不显著,同时来自不同地区的用户之间的缴费情况并没有显著差异。在用户用电满意度方面,对于电能质量的感知更多在于停电的频率与复电的速度,实际上根源是供电稳定满意度,因此电能质量满意度这一变量重复。综上,删除了地区、电能质量满意度、电价、电价满意度4个指标。结合前文的文献整理,最终得到11个指标变量与1个因变量,如表2所示:
4 实证分析
利用国网甘肃省电力有限公司提供的用户用电信息,笔者针对用户缴费这一行为进行实证研究,并预期获取相关隐性知识的潜在因素。
4.1 问卷调研
通过问卷对用电用户的家庭经济情况、居民用户满意度、欠费危害认识度进行调查。家庭经济情况中包括每月收入;居民用户满意度分为供电满意、服务满意、电费信任、缴费方便、渠道满意;欠费危害认识度分为后果认知和行为认知,行为认知指居民用户对于逾期缴纳电费、欠费等行为的看法,后果认知指居民用户对逾期缴纳电费、欠费等行为造成的后果的看法。同时,调研中设置的用户基本信息包含性别。
本次问卷通过社交媒体平台发放,最终获得问卷334份。性别比例上,女性占54.19%,男性45.81%,基本满足男女一比一的比例。来源地区共涉及28个省或直辖市,认为本次问卷回收的地区偏向较小。
对本次回收所得334份问卷进行有效问卷的筛选,删除选择不了解有关用电情况、填写时间小于34秒、前后出现明显逻辑矛盾(如按时缴费获得高分而缴费积极获得低分)、选项完全一样或大部分一样的问卷,最后总计删除45份,保留有效问卷289份,问卷有效率为86.5%。
4.2 信度检验
信度即可靠性,它是指采用同样的方法对同一对象重复测量所得结果的一致性程度。目前最常用的信度系数是Cronbach α信度系数,也就是α信度系数法,其公式为:
通常来讲,数据的信度系数在0.7-0.8之间可以接受,利用SPSS检验数据的信度得到其信度系数为0.752,大于0.7,在可以接受的范围内。
4.3 相关分析
Pearson相关系数可以用来衡量变量之间的线性关系。可以发现,除按时缴费和用电量以及电费信任以外8个自变量在0.05水平上显著相关;每月收入只和按时缴费在0.05水平上显著相关;用电量和所有变量均不在0.05水平上显著相关;缴费积极和按时缴费在0.05水平上显著相关;剩余的供电满意、服务满意、电费信任、缴费便利、渠道满意、行为认知、结果认知这7个变量,每两个变量间都在0.05水平上显著相关。由于用电量和其他所有变量之间都不存在显著相关的关系,可以认为用电量对于因变量按时缴费没有显著的影响,故删去。