论文部分内容阅读
互联网端目标是指位于互联网边缘的端系统或端用户,而端目标画像是能够对端目标本身进行精准刻画的属性集合。端目标智能分析是提取端目标画像的有效手段,是以端目标行为特征或者嵌入表征为基本信息依据,利用人工智能技术从端目标的行为数据中分析得到端目标画像的过程。全面精准的画像能够充分描述端目标的特点,为网络安全、网络管理、电子商务等领域的相关操作提供有效的决策信息。因此,互联网端目标智能分析与画像方法研究具有很高的研究价值和应用价值,受到了国内外社会各界的广泛关注,现已发展成为网络安全、网络管理、电子商务等领域的研究前沿。
互联网端目标智能分析与画像研究正面临着众多挑战,其中最严峻的挑战在于:基于流量行为分析的端目标画像技术大多需要对流量的负载内容进行探测,涉及对用户隐私的侵犯。基于轻量级流量行为分析的端目标画像技术不对流量负载信息进行挖掘,但是所生成的端目标画像内容不够全面,识别和分类的端目标属性过于简单和单一。除此之外,现有的画像技术大多过度依赖行为特征,其刻画能力受限于设计者对分析场景的先验知识。对于端目标的智能分析方法来说,技术需要不断发展才能适应越来越复杂的应用场景,而先进的智能分析技术与端目标分析场景之间仍然存在大量的应用鸿沟,需要根据各自的特点不断进行方法上的匹配设计,才能将前沿分析技术合理地应用于分析场景中。
针对以上挑战,本文对互联网端目标智能分析与画像方法进行了深入研究,取得了以下几项创新成果:
1.对于互联网端目标流量行为刻画研究,从端目标流量行为数据预处理以及端目标流量行为特征提取和嵌入学习的角度出发进行探索:提出了基于高阶统计分析的网络流量分类方法,以应对现有流量分类方法在信息挖掘上的局限性。该方法将高阶统计分析与时频分析理念进行了有机结合,从网络流中提取出精准、有效的网络流特征集,结合对后续分类器的优选,实现了网络流的准确分类。与此同时,本文从端目标流量行为所涉及的各方实体的角度出发,提出了一系列能够刻画端目标流量行为的特征,扩展了端目标流量行为特征集,增强了特征集的刻画能力。
2.对于端目标的人口特征智能分析研究,提出了一种基于层次神经网络的互联网端目标人口特征分类方法。该方法通过引入神经网络分析,解决了现有方法对特征的过度依赖的问题;通过层次性的神经网络结构搭建,实现了对互联网端目标基础属性的深度挖掘;通过设计综合的正则化手段,在保证神经网络总体端到端训练的情况下,实现了对神经网络结构变化的控制,提高了方法在多类别的分类任务中的适应性。
3.对于端目标的情感倾向智能分析研究,提出了一种基于注意力图神经网络的端目标情感倾向分类方法。针对现有情感分类方法对单一信息类别过度依赖的问题,本研究通过设计一种多层级神经网络来进行端目标情感倾向分类,采用注意力图神经网络来进行内容文本信息与端目标连接信息的嵌入层融合,实现了对多源端目标信息的合理利用,完成了对社交互联网端目标情感倾向的准确分类。
4.对于端目标智能分析中的流量行为异常检测研究,提出了一种基于社团划分的互联网端目标流量行为异常检测方法。该方法在对端目标的流量行为进行全面画像的基础上,实现了对单个端目标流量行为异常的准确检测。该方法以多种特征组成特征集的方式来对互联网端目标的流量行为样本进行表征,通过合理的样本差异度量构建互联网端目标的流量行为连接图,作为社团划分算法的分析对象,从而转换得到端目标流量行为社团,最后借由参数可控的异常判定规则来实现对互联网端目标流量行为的异常检测。
本文上述研究内容均利用真实行为数据进行了实验验证,实验结果成功证明了方法的有效性。
互联网端目标智能分析与画像研究正面临着众多挑战,其中最严峻的挑战在于:基于流量行为分析的端目标画像技术大多需要对流量的负载内容进行探测,涉及对用户隐私的侵犯。基于轻量级流量行为分析的端目标画像技术不对流量负载信息进行挖掘,但是所生成的端目标画像内容不够全面,识别和分类的端目标属性过于简单和单一。除此之外,现有的画像技术大多过度依赖行为特征,其刻画能力受限于设计者对分析场景的先验知识。对于端目标的智能分析方法来说,技术需要不断发展才能适应越来越复杂的应用场景,而先进的智能分析技术与端目标分析场景之间仍然存在大量的应用鸿沟,需要根据各自的特点不断进行方法上的匹配设计,才能将前沿分析技术合理地应用于分析场景中。
针对以上挑战,本文对互联网端目标智能分析与画像方法进行了深入研究,取得了以下几项创新成果:
1.对于互联网端目标流量行为刻画研究,从端目标流量行为数据预处理以及端目标流量行为特征提取和嵌入学习的角度出发进行探索:提出了基于高阶统计分析的网络流量分类方法,以应对现有流量分类方法在信息挖掘上的局限性。该方法将高阶统计分析与时频分析理念进行了有机结合,从网络流中提取出精准、有效的网络流特征集,结合对后续分类器的优选,实现了网络流的准确分类。与此同时,本文从端目标流量行为所涉及的各方实体的角度出发,提出了一系列能够刻画端目标流量行为的特征,扩展了端目标流量行为特征集,增强了特征集的刻画能力。
2.对于端目标的人口特征智能分析研究,提出了一种基于层次神经网络的互联网端目标人口特征分类方法。该方法通过引入神经网络分析,解决了现有方法对特征的过度依赖的问题;通过层次性的神经网络结构搭建,实现了对互联网端目标基础属性的深度挖掘;通过设计综合的正则化手段,在保证神经网络总体端到端训练的情况下,实现了对神经网络结构变化的控制,提高了方法在多类别的分类任务中的适应性。
3.对于端目标的情感倾向智能分析研究,提出了一种基于注意力图神经网络的端目标情感倾向分类方法。针对现有情感分类方法对单一信息类别过度依赖的问题,本研究通过设计一种多层级神经网络来进行端目标情感倾向分类,采用注意力图神经网络来进行内容文本信息与端目标连接信息的嵌入层融合,实现了对多源端目标信息的合理利用,完成了对社交互联网端目标情感倾向的准确分类。
4.对于端目标智能分析中的流量行为异常检测研究,提出了一种基于社团划分的互联网端目标流量行为异常检测方法。该方法在对端目标的流量行为进行全面画像的基础上,实现了对单个端目标流量行为异常的准确检测。该方法以多种特征组成特征集的方式来对互联网端目标的流量行为样本进行表征,通过合理的样本差异度量构建互联网端目标的流量行为连接图,作为社团划分算法的分析对象,从而转换得到端目标流量行为社团,最后借由参数可控的异常判定规则来实现对互联网端目标流量行为的异常检测。
本文上述研究内容均利用真实行为数据进行了实验验证,实验结果成功证明了方法的有效性。