【摘 要】
:
针对数据挖掘算法在预测电信客户离网时存在的过拟合问题,提出一种基于特征选择和支持向量机的电信客户离网预测算法。将原始的电信数据分别进行数据缺失值填充、数据冗余识
【机 构】
:
西安邮电大学陕西省信息通信网络及安全重点实验室
【基金项目】
:
陕西省工业科技攻关计划资助项目(2015GY-013,2016GY-113)
论文部分内容阅读
针对数据挖掘算法在预测电信客户离网时存在的过拟合问题,提出一种基于特征选择和支持向量机的电信客户离网预测算法。将原始的电信数据分别进行数据缺失值填充、数据冗余识别、数据结构化和数据归一化等预处理,得到利于分析处理的规范性数据;利用信息增益完成特征选择,提取影响客户离网的主要因素,降低数据维度,防止出现过拟合现象。将经过特征选择后的数据作为支持向量机算法的输入数据对客户是否离网进行分类,预测客户是否存在离网行为。测试结果表明,该算法预测离网客户的正确率为86%,提升了离网客户预测准确率。
其他文献
目的利用新陈代谢GM(1,1)幂模型对我国病毒性肝炎发病率进行预测。方法选取我国2007-2017年的病毒性肝炎发病率资料建立不同维数的GM(1,1)幂模型,通过模型检验选择最佳建模维
为探索昆虫病原线虫与色板配合使用对韭菜迟眼蕈蚊的综合防治技术,采用培养皿滤纸法比较7品系昆虫病原线虫对韭蛆3龄幼虫的致病力,盆栽法研究斯氏线虫属3品系线虫的保苗和防
本文将从瑞昌剪纸艺术的历史沿革、现代文化连接、艺术风格、技法特点、前景与发展等方面入手,阐明瑞昌剪纸艺术的广阔前景以期这一传统文化能生生不息。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
水体叶绿素a含量是二类水体水色遥感反演的主要参数之一。通过分析烟台近海水体实测反射光谱曲线,选取了特征波段及波段组合,建立了研究区叶绿素a含量遥感反演模型。通过对比
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
本文首先针对辐射状沙脊群现有的文献及实测资料,初步分析研究了南黄海辐射沙脊群海域地貌和动力特征,以及动力与地貌的关系。基于过程分裂法及垂向坐标伸缩变换,外模式采用改进
为探讨应用昆虫病原线虫防治小地老虎技术的可行性,采用培养皿滤纸法比较9个品系的昆虫病原线虫对小地老虎幼虫的致病力,同时通过盆栽试验验证了斯氏线虫属小卷蛾斯氏线虫Ste
我国是世界上海洋灾害最严重的国家之一,所造成的总经济损失仅次于内陆的洪涝和风沙等灾害。1980~2002 年的 22 年中,海洋灾害的经济损失大约增长了 30倍,其增长速度高于沿海
目的:针对大多数用血医院的临床输血管理起步较晚,输血技术提高缓慢,科学合理用血的意识和能力不理想的现状,探究建立临床输血质量管理体系对临床输血进行规范化管理,并持续改