在线婚恋平台的异常用户检测技术研究与实现

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:hnyinhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
婚恋社交网络日益盛行且市场广阔,伴随而来的是异常用户利用婚恋平台进行情感欺骗与钱财诈骗。为了保证正常用户婚恋交友的安全,及时识别异常用户并隔离尤为重要。然而针对婚恋平台异常用户检测的研究文献缺乏,现有文献对异常用户的分析不够全面。通过研究发现婚恋平台中异常用户检测存在三个问题:第一是异常用户个性化;第二是正常/异常用户数据集不平衡;第三是用户可研究信息缺乏。为了解决上述问题,本文在基于eXtreme Gradient Boosting(XGBoost)算法的基础上,研究设计了用户信任模型与新的数据平衡方法。具体内容如下:(1)用户信任模型建立,解决异常用户个性化问题。对婚恋社交网络结构、用户特点和异常用户类型进行了研究。将用户基础配置信息、行为特征、交互对话内容、图像数据联合为整体以表示用户信任模型,以此找出正常用户与异常用户的区别。(2)新的数据平衡方法提出,提升异常用户检测召回率。为了解决婚恋平台特有的正常/异常用户数据不平衡与异常用户标签不完全的混合问题,使用混合采样思想解决数据不平衡问题的同时,利用聚类算法提升用户标签准确性,以此解决上述混合问题。(3)基于用户信任模型与平衡方法提出User Trust Model Balance XGBoost(UTMB_XGBoost)异常用户检测方法。通过与常用异常用户检测算法进行对比,以实际的检测结果作为依据发现UTMB_XGBoost检测效果最佳,精确率达到54.55%,召回率达到60%。(4)对 UTMB_XGBoost 不足进行优化,提出 Optimization UTMB_XGBoost(OUTMB_XGBoost)异常用户检测方法,进一步提升检测精确率与召回率。该方法使用矩阵分解算法解决了用户可研究信息缺乏问题,还利用BM25、Word2Vec算法提升了用户对话恶意度检测准确率。通过与UTMB_XGBoost方法对比,OUTMB_XGBoost方法检测精确率提升4.61%达到59.16%,召回率提升13%达到73%。
其他文献
目的:通过分析现代临床应用医案、临床经验及临床病例报道中含有地黄的经方汤剂,对经方汤剂中地黄在临床中主要治疗的疾病、证候、症状、应用剂量及配伍等因素进行探索,以期得到基于现代临床医案的经方汤剂中地黄应用的病-证-量效关系,为临床应用地黄提供参考。方法:依据中国期刊全文数据库(CNKI)中有关含地黄经方汤剂的临床应用相关数据建立数据库,采用SPSS 23.0统计软件对医案中涉及数据进行描述性统计及统
伴随着我国城镇化进展不断深入,政府和市民对城市品质的关注愈发强烈,对城市管理水平的要求日益提高,为满足这种需求,改变传统的突击式、运动式城市管理弊端,包括青岛市在内的各地方政府均对城市管理工作进行了数字化改造,利用各种高新科技手段进行数字化城市管理。本论文采取文献研究法、经验总结法和对比分析法,以青岛市数字化城市管理的管理体系为研究对象,认为青岛市在开展数字化城市管理工作中,确立了管理机构,按标准
随着世界经济的高速发展,环境日益恶化,全球气候变暖已经成为全人类共同关注的环境问题。世界各国开始注重环境保护和污染治理。中国作为世界第二大经济体,在保证经济稳步发展的同时还要完成碳减排目标,承担相应的减排义务,对中国来说是一个巨大的挑战。一方面通过政府引导企业进行碳减排技术开发,企业进行绿色环保的生产方式。另一方面是通过建立全国统一碳交易市场,构建市场机制控制企业碳减排,目前八个碳排放交易试点运作
改革开放四十年来,随着经济、社会的发展和城镇化进程的加快,大量农村年轻劳动力离开农村,前往经济发达的地区工作。这些务工人员一般为夫妻双方,同时因为经济、户籍以及孩子上学等诸多因素,他们将孩子留在农村交由自己的父母或者亲戚照顾,但大多数都是由自己的父母抚养,导致隔代教育的产生。隔代教育的存在,一方面使得年轻父母能够将更多的时间、精力投入工作之中,从而能够获得更高的经济收入,改善家庭经济状况,为儿童提
目的:应用二维斑点追踪技术测量合并S状室间隔的高血压患者的左室心肌纵向应变来评估其左室整体及局部收缩功能,从而探讨S状室间隔是否影响高血压患者的左室收缩功能及其临床意义。方法:本研究分成3组:合并S状室间隔的原发性高血压组(n=34)、不合并S状室间隔的原发性高血压组(n=34)及正常对照组(n=30),这三组研究对象性别、年龄无统计学差异。采用Philips iE Elite彩色超声心动图诊断仪
目的本研究选取在校大学生作为研究对象,采用意守训练作为干预方式,通过应用事件相关电位技术同步检测受试者在干预前后两个时间点,意守状态前后负性及中性刺激下的晚期正成分(Late Positive Potential,LPP)电位均值,比较不同组别受试者在不同状态下LPP电位均值的变化,以探索意守训练对负性情绪的调节效应。方法本研究将招募到北京中医药大学东方学院在校大学生72人,按照1:1的比例用SP
反乌托邦小说的思想源头是现代社会人类生存的危机感与焦虑意识,从20世纪早期至今,涌现出了一大批优秀的反乌托邦小说。英国更是其中的创作高地,有《美丽新世界》、《1984》
硒(Selenium,Se)是一种重要的微量营养元素。硒缺乏时,多种组织、细胞表现不同程度、不同形式的损伤,细胞凋亡是缺硒性损伤的主要表现之一。MicroRNA是一类高度保守的非编码RNA,它通过结合靶基因的3’UTR区域,使其表达沉默,从而调控相应蛋白的表达。研究发现,机体内硒含量降低后,组织中多种microRNA的表达会发生显著变化。本研究通过人工复制缺硒肉鸡模型,筛选出硒敏感性microRN
狮子山铜矿床位于昆阳裂谷滇中地区易门裂陷盆地中,是易门矿田典型铜矿床之一。基于对该矿床成矿地质特征研究,应用大比列尺构造-岩相填图方法,开展狮子山铜矿床构造控矿规律研究,分析控矿构造特征,建立矿区深部构造控矿模式;通过辉绿岩锆石U-Pb年代学和脉状矿石黄铜矿-斑铜矿Re-Os同位素定年,厘定矿区辉绿岩侵入时代和矿床成矿时代;综合以上研究,建立找矿预测模型,进行深部找矿预测。论文主要取得如下成果和认
目的:本研究通过收集肾病综合征(NS)患者的中医体质信息及相关临床资料,探索NS患者的中医体质分布规律,并进一步揭示NS患者的人口学特征、基础疾病、生活习惯、临床指标与中医体质的内在联系,为从中医体质角度辨治NS提供一定的临床依据。方法:选取自2018年12月-2019年12月就诊于我院肾病科住院部的NS患者,根据纳入、排除标准,选择符合标准的NS患者。签署知情同意书后,运用调查表法收集患者的体质