论文部分内容阅读
随着在线交易的快速发展,在线交易欺诈已经越来越普遍,欺诈方式从传统的团伙欺诈发展成平台欺诈。在平台欺诈方式中,由于欺诈者广泛的分布在网络各地,他们之间并不会形成明显的欺诈团伙,所以目前流行的团伙欺诈检测模型并不能够很好的发现平台欺诈者。本文主要提取用户共同交易行为特征属性,并结合社交网络分析和用户特征属性,提出了针对平台欺诈方式的检测模型。具体研究内容如下:首先,通过对平台欺诈中用户交易行为的分析与研究,提出了反转图和同盟对累积交易数,得到用户有关共同交易行为的特征属性。对上述特征属性进行分析,提出合理的属性值度量方法,并且设计并行算法用于计算特征属性值。然后,本文选取和设计了一些用户图级别的重要特征属性,反映用户在交易图中的诚信度和紧密度。通过对交易图进行社交网络分析来获得这些特征属性,考虑到交易图中海量的用户和交易,同样对特征属性值的计算设计了并行算法。文中还提出了一些用户级别的重要特征属性,并对这些特征属性进行了分析。受平台和数据集的限制,本文无法获取全部的用户级特征属性。最终的特征属性集包含了共同交易行为特征属性、图级别特征属性和用户级别特征属性。最后,本文设计了合理的欺诈检测模型,基于时间特性选取最优的数据集。针对类别不平衡分类问题和算法并行可行性问题,最终选择随机森林作为欺诈检测模型的分类算法。通过对比实验说明了选择基于时间特性的最优数据集和用户共同交易行为的特征属性能够提高检测性能,使用随机森林作为分类算法能够取得相对较优的性能。同时,通过实验将本文提出的检测模型与其它模型进行了对比,本文提出的模型能够用于对平台欺诈用户的检测,同时能够适用于真实交易平台中类别不平衡分类问题。本文最后对模型的缺点进行了说明,并提出了可行的解决方案。