基于GroupLasso的多源电信数据离网用户分析

来源 :第六届江苏省计算机大会 | 被引量 : 0次 | 上传用户:jay2722927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着行业竞争愈演愈烈,电信企业的客户流失情况越来越严重,给电信企业造成了巨大损失。通过电信企业的数据来做离网用户的预测从而进一步作出挽留客户的正确决策,成为人们日益关注的问题。面对电信后台汇总的多源数据,经分析发现其呈现天然的组结构。为了选择对于离网类别最具判别性的特征,本文使用了一种基于Group Lasso 的组特征选择方法,在此基础上用交叉验证的方法选择适当的特征组。最终将选择出的少量组特征用于预测离网和停机的宽带用户。实验表明,在江苏某地级市电信离网用户分析数据中取得了比其他特征选择方法的精度(precision)平均高至少10%的预测性能。
其他文献
Hypoxia is a characteristic of most tumor and neurodegenerative diseases with low oxygen condition caused by numerous environmental and genetic aberrations.Study of Hypoxia in neurodegenerative diseas
无线人体局域网利用前导结构前面的63Bit m序列对数据分组起始进行粗略估计,利用前导结构的后27Bit的扩展序列进行精确的符号同步。将载波同步输出的数据和本地已知的前导结构的扩展序列符号进行共轭复数相乘且累加,得互相关系数,利用互相关系数绝对值的峰值判断一个扩展序列符号的结束,计算峰值出现的次数和位序,即可得到同步的序号位置。其中对符号同步算法进行了简化,如用预设门限值的方法来找峰值,用累加扩展
DBSCAN 是一个经典的基于密度的聚类算法,它能够在含有噪声的数据中发现任意形状的簇。但效率较低,其时间复杂度为O(n2)。本文在其基础上提出一种改进算法F-DBSCAN,算法对核心对象邻域中的对象只作标记,不再进行扩展检查。通过判断核心对象邻域中是否存在已标记对象来实现簇合并。对边界对象判断其邻域中是否存在核心对象来确认是否为噪声。此方法避免了原始算法中对重叠区域的重复操作,在不需创建空间索引
会议
空域和频域分析是图像分析的重要方法,提出一种融合空域的局部二值模式(local binary pattern,LBP)和频域的局部相位量化(local phase quantization,LPQ)进行人脸识别的方法。该方法首先对人脸图像分别在空域提取LBP 特征和频域提取LPQ 特征,然后融合成LBP/LPQ 直方图,进行直方图相似性比较,最后根据最近邻原则进行识别。在YALE 和AR 标准人脸
会议
RSA 算法密码体制安全性很高,许多密码系统中都嵌有RSA 密码算法,不仅可以加密,还可用于签名,但是,其速度较慢影响了它的应用。本文在有限域上给出一类新的置换多项式,并证明该置换多项式在有限域上是互逆映射的,从而可以构造了一个RSA 公开密钥密码体制。最后,本文对该体制的安全性和运算速度作了分析。
会议
网页内容分析及分类方法作为用户行为分析、兴趣识别、舆情分析等上层应用的底层核心技术逐渐成为学术界乃至工业界的热点。基于标签数据建立机器学习模型的传统网页分类算法已经无法适应移动互联网时代海量数据的迭代更新需求。本文提出一种基于知识网络架构的非监督网页分类方法。该方基于维基中文知识库作为知识网络,标定少量网络上层基础词汇和网络热词的类目体系,利用知识网络的传递性来遍历计算所有节点关键词的类目属性。文
会议
基于统计学习理论的过滤系统设计常用的有贝叶斯方法和支持向量机。支持向量机相对于贝叶斯方法在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。采用PEGASOS 算法最优化SVM 目标函数设计线性分类器,并通过垃圾邮件的过滤测试分析表明:基于PEGASOS 算法优化SVM 设计的分类器具有较高的分类精度和收敛速度;同时,通过最佳的最大范数约束,可以显著增大分类间隔。
会议
针对二级轻气炮毫米级弹丸的速度测量存在干扰大,误差大问题,本文设计并实现一种利用激光光幕测量弹丸飞行速度的测试系统。系统采用红光半导体激光器作光源,多个光电二极管并联平行排布作为光电探测器,形成双幕光幕靶。通过信号处理电路对弹丸信号进行处理,然后基于PCI 总线的数据采集卡对输出信号进行采集,并设计了上位机控制软件,实现了对信号的高速数据采集和实现图形显示等功能。现场实验结果表明,该系统具有采样速
会议
脉络膜是眼睛的血管层,脉络膜层的准确分割对于揭示与其相关的视网膜病变有重要的意义.本文提出了一种在频域光学相干断层扫描技术(SD-OCT)图像下的脉络膜自动分割算法.算法共分为两部分,Bruch膜(BM)分割和脉络膜-巩膜分界面(CSI)分割.Bruch 膜分割主要利用SD-OCT 图像下的灰度和梯度信息.分割CSI 时,本文提出了一种基于线性模板和前后帧约束的算法实现自动分割.对于来自10 位病
会议
随着工业生产的不断发展,工业控制软件日益复杂。传统的基于设备驱动程序的数据传输方式已经不能满足现实的需要,OPC 标准通信协议应运而生。本文提出了一种在嵌入式实时操作系统VxWorks 下开发OPC服务器应用软件的方法,并开发了一款遵循OPC 数据存取规范的OPC 服务器软件。该OPC 服务器基于VxWorks提供的VxDCOM 组件,相比基于Windows COM/DCOM 的OPC 服务器软件
会议