面向软件缺陷个数预测的混合式特征选择方法

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:xinxinde1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的混合式特征选择方法——HFSNFP。首先,利用Relief F算法计算每个特征与缺陷个数之间的相关性,选出相关性最高的m个特征;然后,基于特征之间的关联性利用谱聚类对这m个特征进行聚类;最后,利用基于包裹式特征选择思想从每个簇中依次挑选最相关的特征形成最终的特征子集。实验结果表明,相比于已有的五种过滤式特征选择方法,HFSNFP方法在提高预测率的同时降低了误报率,且G-measure与RM
其他文献
随着社区规模的不断扩大,基于标签传播思想的重叠社区发现算法得到较大发展。经典重叠社区发现算法虽然很好地利用了标签随机传播特性实现了重叠社区发现,但是也导致该算法输出结果很不稳定、社区生成质量较差。为克服采用最新的ClusterRank为所有节点排序降低随机性带来的结果稳定性差的弊端,引入最大社区节点数以控制最大社区节点数目,防止远大于其他社区的Monster出现。采用真实数据集和人工网络验证,结果
针对e指数函数运算中常见硬件实现方法资源消耗大的问题,提出基于泰勒展开的指数函数的优化实现。首先,通过对输入值进行区间压缩以减小泰勒展开计算的求解误差;其次,对e指数函数泰勒展开公式的系数进行修正;最后,在硬件实现中通过合并化简运算实现资源的精简。实验表明。该方法在TSMC 65 nm工艺下的面积为11 068μm~2,折合1 976门,运算结果的相对误差仅有10~(-2)~10~(-3)。相比于
为满足机器人学学习过程中的实验需求,描述了一个基于Qt和Ogre3D机器人学坐标变换虚拟实验室的设计和使用。本虚拟实验室针对机器人学的坐标变换,在虚拟环境中通过实验来表明欧拉角、RPY角、转轴/角度、单位四元数和齐次变换矩阵的关系,并且使用虚拟手段阐述了DH矩阵的空间意义,通过数值计算和虚拟显示详细地解释这些概念的意义。其描述了这些虚拟实验的使用方法。为了判断此虚拟实验室的有效性,设计了一个教学实
企业对产品进行创新改进,带来装配线上装配任务的变化,从而造成已平衡装配线的失衡。针对上述变化给企业混流装配线带来的影响进行了研究,以最小化生产节拍、工作站间的负荷和工人完成新装配任务的调整成本为优化目标来建立混装线再平衡的数学模型;设计了一种新的多目标粒子群算法求解模型,算法中引入各粒子动态密集距离去筛选外部文档的非劣解和指导全局最优值的更新,在控制解的容量的同时保持Pareto解集分布均匀;此外
针对无线传感器网络在监测类似室内或大棚等微气候环境数据时,传统的等间隔时间数据采集方法存在数据大量冗余、浪费网络带宽的问题,以及现有自适应变频数据采集策略仍然非常复杂的问题,提出一种基于旋转门算法的自适应变频数据采集策略,该策略根据旋转门算法能否"套住"数据以及能连续"套住"数据的次数,自适应地调整数据采集的间隔时间。仿真和实验结果证明,该策略与传统的等间隔时间数据采集方法相比,可以降低数据采集量
针对现有的回归模型未考虑特征之间的深层结构,而导致在回归问题上输出不稳定的模型,提出了一种新的属性选择方法。通过稀疏学习理论中的2,1-范数和2,p-范数在线性回归模型分别进行样本降噪和属性选择,利用超图结构和低秩约束来分别考虑数据间的局部结构和不同数据间的全局结构,最后结合子空间学习方法来对模型进行微调。经实验证明,在回归分析中该算法较对比算法能取得更好的效果。