基于XGBoost算法结合域名信息筛选的流量识别方法

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:zibzibzib
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的流量识别方法主要有基于流量行为特征的指纹信息匹配技术、深层数据包检测技术、基于端口映射的流量识别技术等。基于机器学习的识别技术是目前较为先进的一种,它利用机器学习自学习、自组织和自适应的特性,可有效解决传统流量识别方法存在实现复杂、速率慢等问题,但是由于网络环境当中存在大量的背景流量,导致机器学习的精确率较低。本文针对传统的流量识别技术和单纯机器学习方法的缺陷,提出了一种使用XGBoost机器学习模型与域名信息结合的方式进行流量识别的技术,首先分别对HTTP协议数据和HTTPS协议数据构建机器学习模型进行流量的初步识别,然后构建应用与其二级域名的映射关系。对于模型识别为正类的数据提取域名信息(HTTP提取host字段、HTTPS提取SNI域),最后根据应用与二级域名的映射关系对模型识别的结果进行二次筛选,进一步提高准确率。
其他文献
目的探讨剖宫产术后给予低剂量缩宫素联合小剂量米索前列醇对预防产后出血的效果。方法选取2018年1月至2019年3月本院收治的剖宫产产妇80例作为研究对象,随机分为常规组(n=40
听觉艺术,教育作为门类艺术教育基本形式之一,是以听觉艺术为媒介而实施的教育。听觉艺术是凭借听觉感官及其相应的媒介手段传达和接受时间意象的艺术。听觉艺术教育所使用的
文章运用描述统计分析和CiteSpace分析法,对国内自驾车旅游研究进行了可视化分析,研究发现:从发文量来看,国内自驾车旅游的发文量呈现出波动式增长态势;从发文机构来看,发文量
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的分析血清hs-CRP、免疫球蛋白及肺炎支原体DNA对支原体肺炎的诊断价值。方法选取2017年3月至2018年5月本院收治的支原体肺炎患儿70例作为观察组,并选取同期体检健康儿童70
目的分析脑梗死患者血细胞及生化指标检测结果。方法选取2017年1月至2019年1月本院收治的68例脑梗死患者为分析组,根据脑梗时间长短将其均分为1组(急性脑梗死)及2组(慢性脑梗
以硫酸氢钾为催化剂,研究了对硝基苯甲酸和乙醇反应生产对硝基苯甲酸乙酯的合成工艺.考察了催化剂用量、反应时间、醇酸物质的量之比、带水剂用量以及催化剂重复使用次数对酯
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技