论文部分内容阅读
随着云计算和大数据等互联网技术的升级换代,以传统金融体系为依托的在线交易业务得到了蓬勃发展。然而,大量的数据存储在无边界的云服务器上,用户个人信息泄露成为严重隐患。具体而言,如若用户的个人标识和关键口令被不法之徒窃取,转而进行在线交易,这不仅损害了真实用户的财产,也会对平台的安全信誉产生了不良影响。基于上述盗卡盗账户的欺诈问题,本研究提出了一套系统性的解决方案:其一,构建了一套多模块的在线交易欺诈识别指标体系框架,创新性的引入用户支付行为信息,产品交易品类信息,物流收获信息等模块;其二,改进RFM理论,提出一种新的样本均衡方法RFM聚类-SMOTE方法,解决欺诈识别中的风险用户识别率远低于正常用户识别率的问题;其三,针对不同样本均衡方法和特征工程方法处理后的均衡数据集,对比多组不同机器学习分类算法下的模型效果,以实现一个风险用户识别率较高的全局最优的预测模型。 为论证拟议方法有效,本研究收集了某家B2C公司2000万用户近一年的交易数据和风险数据进行分析建模,以此作为在线交易欺诈识别问题的实证研究对象。验证结果表明,本文所提出的指标体系能够有效的覆盖欺诈用户的行为特征,RFM聚类-SMOTE样本均衡方法能够极大地提高风险用户识别率,此外,在同一数据集上支持向量机和多层感知机的非线性算法的识别效果优于线性算法。通过以上方法和研究成果,可以有效增强B2C平台对欺诈用户的识别预防能力,进而保障真实用户的权益,维护平台和电子商务产业的长期稳定发展。