基于分层欠采样和Bi-GRU的恶意行为检测模型

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:a391137182
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG).数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区、稀疏区边界区及稠密区3个区域,根据抽取出样本标签数在稠密区内划分出不同层次圆环,计算每个类的不均衡度,计算其均值作为整个样本的采样比例,按照此时的采样比例在稀疏区边界区的圆环域和稠密区进行分层随机欠采样;将文本向量输入训练好的Bi-GRU模型中.实验结果表明,该模型改善了整体检测效果,提高了恶意评论检测率.
其他文献
针对现有基于商用WiFi设备的人体手势识别方法存在的子载波选择不够优化、动作区间截取不够精确等问题,提出一种基于近似熵子载波选择的人体手势识别(AEGR)方法.利用提出的最小近似熵法构建识别方法待处理的CSI幅值数据,对构建的数据采用小波去噪和中值滤波组合法进行去噪;利用滑动窗极差法精确截取CSI幅值的动作区间,据此提取用于分类的8个特征量;利用随机森林算法进行人体手势识别.实验结果表明,AEGR方法的手势识别准确率可达98.75%,验证了其良好性能.
为解决移动传感网在拓扑流动性较高情形下存在的定位精度不高、数据传输能力不理想等不足,提出基于双焦点离心测距机制的移动传感网高效定位算法.对多跳路径进行弧度处理,构建基于弧度路径析构的节点椭圆定位机制,将直线路径析构为椭圆弧度边长,避免因裁弯取直而导致定位距离出现偏移,结合锚节点坐标已知的特性,对待定位终端坐标进行精度修正.设计基于椭圆纵半径跳数优化的动态测距机制,降低待定位节点与锚节点之间拓扑跳数,改善节点定位精度.仿真结果表明,与当前常用的WSN定位算法相比,所提算法具有更高的定位精度和更低的定位次数.
为基于国产平台研发安全可靠的远程桌面程序,对目前已有的各种远程桌面程序进行分析与研究,其中重点研究Linux平台上基于RFB协议的VNC程序.针对基于RFB协议的VNC程序,对其基本框架及工作流程进行分析与研究,重点研究图像消息的传输、屏幕变化的检测以及图像的压缩编码方式,针对目前国产化发展应用需求以及现状,为进一步提升VNC程序的性能,以满足国产信息系统的新需求,提出未来需改进的方向.
针对现有BPLC网络组网协议在回复关联确认消息的数量和时间上存在冗余的问题,对BPLC报文交互过程进行研究,提出一种基于自适应组播的高效组网协议.通过自适应地聚合关联确认消息并采用组播方式发送,在减少控制开销的同时加速发送部分关联确认消息.理论分析显示了该协议的有效性.仿真结果表明,与现有BPLC网络组网协议相比,该协议能够减少5.88%以上的控制开销并降低5.53%以上的入网时延.
基于已有的区块链和访问控制相结合相关的研究存在难管理访问权限、低效率、难支持轻量级物联网设备的缺点,提出一种基于属性的物联网访问控制模型.通过引入属性的概念,支持细粒度的访问控制;将访问控制策略以智能合约部署在区块链上,降低物联网设备的计算压力,使该策略可以应用于轻量级设备;引入token概念,通过访问主体提前申请访问权限,提高访问效率.搭建原型系统,通过案例分析和安全性分析,验证了该访问控制模型的有效性.
为加快深度学习人脸检测算法MTCNN(multi-task convolution neural network)的推理速度,满足许多应用场合检测的实时性的要求,基于Xilinx FPGA ZCU102开发板设计针对MTCNN专门优化的卷积和全连接加速硬件.该加速硬件不仅适用于MTCNN网络,其它神经网络推理算法也可以使用.针对算法特点,硬件采用小而多的计算核心,支持动态分块、图像间混合计算、片上多核共享RAM等完全自主开发的软硬件协同技术.在100 MHZ的频率下对MTCNN应用在加速器上的加速效果进行
针对彩色图像在加密过程中数据量大、相邻像素相关性强及冗余度高等缺陷,提出基于新四维超混沌的彩色图像加密算法.利用混沌性能更好的四维超混沌系统与反向传播神经网络结合进行序列融合运算,生成伪随机性更好的融合序列作为密钥流;利用密钥流对彩色图像像素块进行位置置乱及像素扩散运算,得到最终的密文图像.仿真计算结果表明,该加密算法具有良好的安全性及抗攻击能力.
为有效解决HDFS面对多类型的海量小文件存在存储效率与检索速率低下的问题,构建一种基于EHDFS架构的存取方案.存储阶段,引入最优化策略,建立新的合并存储模型,使小文件最大化填满且均匀分布于Block,提高DataNode空间利用,降低NameNode内存开销.检索阶段,改进MapFile映射关系结构、索引存储位置与组成元素以建立新的文件索引模型,避免跨跃式文件搜索,实现小文件的集中检索.实验结果表明,对比多种大数据存储模型,在不同数据量的分组压力测试下,该方案有效提高了HDFS的存取效率.
为解决传统核极限学习机算法参数优化困难的问题,提高分类准确度,提出一种改进贝叶斯优化的核极限学习机算法.用樽海鞘群设计贝叶斯优化框架中获取函数的下置信界策略,提高算法的局部搜索能力和寻优能力;用这种改进的贝叶斯优化算法对核极限学习机的参数进行寻优,用最优参数构造核极限学习机分类器.在UCI真实数据集上进行仿真实验,实验结果表明,相比传统贝叶斯优化算法,所提算法能提升核极限学习机的分类精度,相较其它优化算法,所提算法可行有效.
针对睡眠分期中样本不平衡问题,提出以最短路径为指标选取最优数据进行数据生成的思想,增加少数类样本的数量.基于Border-SMOTE算法,提出改进的iBorder-SMOTE睡眠数据生成算法.用密度峰值聚类算法确定待生成数据的簇类别区域,采用中心最短路径选取最优数据点进行数据生成,使用异变扰动方法对生成数据进行修正,保证数据的全局分布.在数据集Sleep-EDF上进行验证,其结果表明,改进后的算法有效提高了少数类样本的识别精度.