论文部分内容阅读
【摘 要】供电企业作为国家和政府服务部门,应结合供电企业的特点建立自己的信誉管理体系。定风险预警登记,加强电费风险规避机制,建立以客户需求为导向以支撑营销业务快速发展为主线,以深化营销业务系统应用为基础,以拓展电费回收风险防控分析为重点应用的新型客户互动服务体系。
【关键词】大数据分析;电费风险
1电费风险类型
1.1电费计费差错
电量测量的设备在进行安装的时候虽然都会提前进行比较周密的检查,确定设备的合理性,但是由于设备在使用的时候会因为使用年限久远产生超出可接受范围的误差,这就使得电费的记录也会存在误差。有些素质低下的用电人员会利用电量计量上产生的误差以及设备的漏洞,利用一些装置进行电量的盗取。这就使得电量测量的安全效果遭到破坏,电费的实际价格就无法得到公正的显示以及收取。
1.2用电报装的差错
客户在需要用电的时候会利用书面申请的方式向电力公司申请用电以及供电装置的安装。专业工作人员会进行现场勘查,按照双方都合理接收的意愿进行供电合同的签订,在之后安装电能计量表,通电运行。用电供电的过程中主要会出现一些潜在的电力风险,用电设备的使用周期、供电项目的合法程度、电费误差风险、用电客户的诚信度等。这些都是影响、贯穿于用电报装风险的非常重要的部分。
1.3人工抄表收费的差错
电力公司的工作人员定期前往客户所在地记录客户电能计算装置的数据。用电量收费会按照合约中所约定的电费计量政策进行电费的计量,然后通知客户进行电费的缴纳。供电企业在抄表到收费的过程中,都需要工作人员进行人工抄记录工作和录入计算机系统。所以,供电企业的记录人员存在一定的责任风险以及操作风险,供电企业抄表收费一定要注意电费风险的问题。
2基于大数据分析的电费风险防控系统建设
2.1数据采集
目前电力营销管理系统使用传统的关系型数据库存储用电客户、电费、业扩、用检、稽查等数据。企业基本信息、企业法人个人征信、纳税证明信息、银行贷款信息等数据需从工商管理局、银行、征信等专业系统获取,需考虑各系统的数据存储方式及获取方式的多样性。企业经营状况、国家宏观经济环境、区域社会环境等半结构化或非结构化数据主要是借助网络爬虫或网站公开API等方式获取数据。
2.2数据处理与分析
2.1数据预处理
当今数据库极易受噪声、丢失数据和不一致数据的侵扰,数量太大,并且多半来自多个异构数据源,导致数据质量较低,低质量的数据将导致数据分析的结果不准确,因此在模型训练之前,需要进行数据预处理。数据预处理主要从特征因素量化、缺失值处理、无效值处理等方面展开。
2.2特征变换
为更好地进行模型训练,需要进行特征因子化转换:(采用0/1/2/3…数字编码来表达。)例如以下特征:①行业、行业分类、行业大类、高耗能行业、用电类别、电压等级、是否预购电用户;②回款时长是否超过5天、回款时长是否超过10天、回款时长是否超过15天、是否存在逾期;③是否存在投诉记录、历史投诉次数、是否存在在途电费退补流程、是否存在在途电表申校流程、是否代扣异常、是否存在故障换表流程;④是否纳入人民银行信用平台。
2.3大数据分析构建模型
2.3.1大数据分析构建模型
将问题定义为二元分类/三元分类问题,采用随机森林、逻辑回归、决策树、支持向量机进行模型训练。
2.3.2电费风险模型算法研究
采用逻辑回归、随机森林、决策树、支持向量机(SVM)等方法来训练与建模,分别分析客户下月是否有风险。(1)逻辑回归(logisticregression)是广义线性模型的一种,可根据一组数值变量预测二元输出。(2)随机森林(randomforest)是一种组成式的有监督学习方法。在随机森林中,同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。(3)决策树(DT)是一种基本的分类和回归方法。在分类问题中它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。(4)SVM旨在在多维空间中找到一个能将全部样本单元分成两类的最优平面,这一平面应使两类中距离最近的点的间距(margin)尽可能大,在间距边界上的点被称为支持向量(supportvector,它们决定间距),分割的超平面位于间距的中间。
3基于大数据分析的电费风险防控策略
3.1建立科学的电费风险管理信息系统
首先电力企业要建立适应自身发展的电费风险管理系统,要紧跟时代潮流,派遣专业的人士对信息系统进行完善和补充,对于电费风险管理信息系统要成立专门的管理部门,其次,要对相关的信息系统进行不定期或定期的整修与维护,要及时的解决和完善发现的问题,要对相关的系统进行不定性,不定量的测试,将信息系统的作用最大程度的发挥出来,对于电费风险管理信息系统的安全建设要特别的重视,除了学习其他企业优秀的管理经验外,还要设置必要的密码访问,操作权限规定,防火墙等。要不定时的更新与补足信息系统的管理方式与手段,从而确保信息系统能够持续的为电力企业及电力风险管理的长久发展提供更好的服务。
3.2强化电费回收
依据电费回收风险客户风险等级划分的结果,可在实际业务场景中进行应用,建议可针对抄表员、管理层等不同岗位设计标签及其应用场景。抄表员在电费回收工作各阶段,利用客户风险等级标签筛选客户群体,指导电费回收工作。一是在抄表阶段,针对高风险、中风险客户,尽量做到优先抄表、当面抄表。并根据移动终端的提示,核实用户的联系信息,包括户号、户名、联系电话、通信地址等。二是在派送电量电费通知单工作阶段,针对高风险、中风险客户,应粘贴纸质通知单,并尽可能当面通知客户;针对低风险客户,可以采用发送电子账单的形式通知,包括短信账单、微信账单、邮件账单等。三是在派送催费通知单工作阶段,及时跟进高风险、中风险客户的电费缴纳情况,增加催缴频率和力度。并根据资源情况,采取电话的方式进行催费。对于管理层,可采取按电费风险等级排序,优先开展重点催费措施;或针对高风险用户提高催费短信发送频率,差异化催费内容,对低风险等级用户降低催费短信发送频率等。
3.3完善电费核算
通过绘制电量波动率直方图、电量差直方图来观察客户用电分布规律,观察发现客户用电波动情况符合典型正态分布。对于这种分布,从统计学的角度分析合理波动率及差值区间。运用“超出中位数2倍四分位差”的异常数据诊断算法,该算法将同类的一组数据进行排序然后测度顺序数据的离散程度,可以衡量中位数的代表性高低。具体在本项目中的做法,即将同一类用户(如居民用户)的同比上期、环比上期抄表数据按电量差值及波动率分别排序,在每个排序数列中用3个点将全部数据分为4等份,与这3个点位置上相对应的电量差值(波动率)称为四分位数,其中下四分位数等于该样本数据从小到大排列后第25%的数值,中位数为该样本数据从小到大排列后第50%的数值,上四分位数等于该样本数据从小到大排列后第75%的数值,四分位差=(上四分位数-下四分位数),则该类用户的电量差值(波动率)的异常阈值=中位数+2×四分位差。运用四分位数算法计算得到各类用电客户用电量突增率、突减率、突增值、突减值的阈值,根据此阈值在系统中设置可调变量的验证规则并校核出的电量异常客户,自动生成《电费异常复核清单》下发复核。
4结束语
通过本项目的设计开发,建立科学、完善的用户电费风险预测模型,预测下一个周期可能发生电费回收风险的客户。建立覆盖客户全业务全环节的预付费/后付费方式选择、预收策略、发行时间、结算频度、交费方式、催费策略、停限电策略、电费保全策略、欠费处置策略等风险防控策略库。
参考文献:
[1]王鑫,杜颖,张金桂,刘宏国,张春秋,刘东丹.大数据技术在潜在电费风险挖掘中的应用[J].自动化与仪器仪表,2018,01:123-125.
(作者單位:国网衡水供电分公司)
【关键词】大数据分析;电费风险
1电费风险类型
1.1电费计费差错
电量测量的设备在进行安装的时候虽然都会提前进行比较周密的检查,确定设备的合理性,但是由于设备在使用的时候会因为使用年限久远产生超出可接受范围的误差,这就使得电费的记录也会存在误差。有些素质低下的用电人员会利用电量计量上产生的误差以及设备的漏洞,利用一些装置进行电量的盗取。这就使得电量测量的安全效果遭到破坏,电费的实际价格就无法得到公正的显示以及收取。
1.2用电报装的差错
客户在需要用电的时候会利用书面申请的方式向电力公司申请用电以及供电装置的安装。专业工作人员会进行现场勘查,按照双方都合理接收的意愿进行供电合同的签订,在之后安装电能计量表,通电运行。用电供电的过程中主要会出现一些潜在的电力风险,用电设备的使用周期、供电项目的合法程度、电费误差风险、用电客户的诚信度等。这些都是影响、贯穿于用电报装风险的非常重要的部分。
1.3人工抄表收费的差错
电力公司的工作人员定期前往客户所在地记录客户电能计算装置的数据。用电量收费会按照合约中所约定的电费计量政策进行电费的计量,然后通知客户进行电费的缴纳。供电企业在抄表到收费的过程中,都需要工作人员进行人工抄记录工作和录入计算机系统。所以,供电企业的记录人员存在一定的责任风险以及操作风险,供电企业抄表收费一定要注意电费风险的问题。
2基于大数据分析的电费风险防控系统建设
2.1数据采集
目前电力营销管理系统使用传统的关系型数据库存储用电客户、电费、业扩、用检、稽查等数据。企业基本信息、企业法人个人征信、纳税证明信息、银行贷款信息等数据需从工商管理局、银行、征信等专业系统获取,需考虑各系统的数据存储方式及获取方式的多样性。企业经营状况、国家宏观经济环境、区域社会环境等半结构化或非结构化数据主要是借助网络爬虫或网站公开API等方式获取数据。
2.2数据处理与分析
2.1数据预处理
当今数据库极易受噪声、丢失数据和不一致数据的侵扰,数量太大,并且多半来自多个异构数据源,导致数据质量较低,低质量的数据将导致数据分析的结果不准确,因此在模型训练之前,需要进行数据预处理。数据预处理主要从特征因素量化、缺失值处理、无效值处理等方面展开。
2.2特征变换
为更好地进行模型训练,需要进行特征因子化转换:(采用0/1/2/3…数字编码来表达。)例如以下特征:①行业、行业分类、行业大类、高耗能行业、用电类别、电压等级、是否预购电用户;②回款时长是否超过5天、回款时长是否超过10天、回款时长是否超过15天、是否存在逾期;③是否存在投诉记录、历史投诉次数、是否存在在途电费退补流程、是否存在在途电表申校流程、是否代扣异常、是否存在故障换表流程;④是否纳入人民银行信用平台。
2.3大数据分析构建模型
2.3.1大数据分析构建模型
将问题定义为二元分类/三元分类问题,采用随机森林、逻辑回归、决策树、支持向量机进行模型训练。
2.3.2电费风险模型算法研究
采用逻辑回归、随机森林、决策树、支持向量机(SVM)等方法来训练与建模,分别分析客户下月是否有风险。(1)逻辑回归(logisticregression)是广义线性模型的一种,可根据一组数值变量预测二元输出。(2)随机森林(randomforest)是一种组成式的有监督学习方法。在随机森林中,同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。(3)决策树(DT)是一种基本的分类和回归方法。在分类问题中它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。(4)SVM旨在在多维空间中找到一个能将全部样本单元分成两类的最优平面,这一平面应使两类中距离最近的点的间距(margin)尽可能大,在间距边界上的点被称为支持向量(supportvector,它们决定间距),分割的超平面位于间距的中间。
3基于大数据分析的电费风险防控策略
3.1建立科学的电费风险管理信息系统
首先电力企业要建立适应自身发展的电费风险管理系统,要紧跟时代潮流,派遣专业的人士对信息系统进行完善和补充,对于电费风险管理信息系统要成立专门的管理部门,其次,要对相关的信息系统进行不定期或定期的整修与维护,要及时的解决和完善发现的问题,要对相关的系统进行不定性,不定量的测试,将信息系统的作用最大程度的发挥出来,对于电费风险管理信息系统的安全建设要特别的重视,除了学习其他企业优秀的管理经验外,还要设置必要的密码访问,操作权限规定,防火墙等。要不定时的更新与补足信息系统的管理方式与手段,从而确保信息系统能够持续的为电力企业及电力风险管理的长久发展提供更好的服务。
3.2强化电费回收
依据电费回收风险客户风险等级划分的结果,可在实际业务场景中进行应用,建议可针对抄表员、管理层等不同岗位设计标签及其应用场景。抄表员在电费回收工作各阶段,利用客户风险等级标签筛选客户群体,指导电费回收工作。一是在抄表阶段,针对高风险、中风险客户,尽量做到优先抄表、当面抄表。并根据移动终端的提示,核实用户的联系信息,包括户号、户名、联系电话、通信地址等。二是在派送电量电费通知单工作阶段,针对高风险、中风险客户,应粘贴纸质通知单,并尽可能当面通知客户;针对低风险客户,可以采用发送电子账单的形式通知,包括短信账单、微信账单、邮件账单等。三是在派送催费通知单工作阶段,及时跟进高风险、中风险客户的电费缴纳情况,增加催缴频率和力度。并根据资源情况,采取电话的方式进行催费。对于管理层,可采取按电费风险等级排序,优先开展重点催费措施;或针对高风险用户提高催费短信发送频率,差异化催费内容,对低风险等级用户降低催费短信发送频率等。
3.3完善电费核算
通过绘制电量波动率直方图、电量差直方图来观察客户用电分布规律,观察发现客户用电波动情况符合典型正态分布。对于这种分布,从统计学的角度分析合理波动率及差值区间。运用“超出中位数2倍四分位差”的异常数据诊断算法,该算法将同类的一组数据进行排序然后测度顺序数据的离散程度,可以衡量中位数的代表性高低。具体在本项目中的做法,即将同一类用户(如居民用户)的同比上期、环比上期抄表数据按电量差值及波动率分别排序,在每个排序数列中用3个点将全部数据分为4等份,与这3个点位置上相对应的电量差值(波动率)称为四分位数,其中下四分位数等于该样本数据从小到大排列后第25%的数值,中位数为该样本数据从小到大排列后第50%的数值,上四分位数等于该样本数据从小到大排列后第75%的数值,四分位差=(上四分位数-下四分位数),则该类用户的电量差值(波动率)的异常阈值=中位数+2×四分位差。运用四分位数算法计算得到各类用电客户用电量突增率、突减率、突增值、突减值的阈值,根据此阈值在系统中设置可调变量的验证规则并校核出的电量异常客户,自动生成《电费异常复核清单》下发复核。
4结束语
通过本项目的设计开发,建立科学、完善的用户电费风险预测模型,预测下一个周期可能发生电费回收风险的客户。建立覆盖客户全业务全环节的预付费/后付费方式选择、预收策略、发行时间、结算频度、交费方式、催费策略、停限电策略、电费保全策略、欠费处置策略等风险防控策略库。
参考文献:
[1]王鑫,杜颖,张金桂,刘宏国,张春秋,刘东丹.大数据技术在潜在电费风险挖掘中的应用[J].自动化与仪器仪表,2018,01:123-125.
(作者單位:国网衡水供电分公司)