论文部分内容阅读
目前针对基于机器学习的DGA算法生成域名检测方法普遍存在的特征信息不全、检测精度不高等问题,提出了一种基于stacking集成学习的DGA域名检测方法。通过挖掘正常域名和DGA生成域名的字符特征、语言特征,并进一步提取出域名的衍生特征HMM系数共同作为域名特征,选择距离预测方法的KNN模型和基于超平面分类方法的SVM模型,并使用基于梯度提升迭代决策树方法的Cat Boost模型共同作为基分类器,同时以SVM作为第二层元分类器进行回归,通过stacking集成学习方法对DGA域名进行检测。实验证明,该方法一