特征选择算法相关论文
在软件工程中,软件缺陷是对软件质量影响最大的因素。人工审查代码的速度和效率已经日趋不能满足软件系统生产发展的需要,因此,高......
为了预测未来的网络安全态势,前人提出了很多预测模型,包括人工神经网络、支持向量机、灰色verhulst模型和其他很多模型.然而前人......
PET/CT孤立性肺结节计算机辅助诊断模型中,从结节影像学的特征角度来预测良恶性是辨别肺结节性质的关键.为了构造一个良好的诊断预......
EP(Emerging Patterns)模式是一种在不同数据类别中,支持度相差很大的模式。它是由跟类属性强关联并且相互之间没有冗余信息的属性......
数据的特征选择是当前信息领域的研究热点之一.本文从不同的分类角度分析了特征选择算法的特性并列举了对应的较为重要且具有代表......
电力变压器是电力系统中的重要设备之一,其运行状态关系整个电网的安全。基于振动法分析变压器运行状态,是变压器在线监测的一种有效......
近年来互联网大规模异常事件频繁发生,在即将万物互联情况下互联网安全问题显得尤为突出。网络流量异常检测作为网络安全的核心技术......
近年来,随着信用消费经济模式的发展,人们的交易方式发生了巨大的改变。有数据表明,目前在银行等信用机构中,个人贷款的份额在不断增加......
糖尿病足溃疡作为典型的慢性伤口是糖尿病人致残、致死的主要原因,目前糖尿病足发病率已呈现高发态势,由此导致的慢性伤口感染已经成......
软件缺陷预测技术能有效辅助软件测试保证软件质量。然而,数据的不平衡性会使训练时过多关注多类无缺陷模块而对少类有缺陷模块训练......
软件缺陷预测技术能够在软件开发初期尽早的发现软件缺陷,有助于合理地分配测试资源,降低软件开发和维护成本,是保证软件可靠性的重要......
Internet已经成为人们生活和经济活动中一个不可或缺的重要组成部分,为了监测网络是否安全、高效、稳定地运行和维护,必须对网络流......
特征选择通过选择一个最优的特征子集降低数据维数,构造一个简洁的分类系统,提高分类预测的准确性,揭示隐藏的潜在模式和规律,得到一个......
本文的主要工作包括:1) 介绍了统计学习理论和支持向量机,各种常见的变形支持向量机算法,特别是广义支持向量机公式。文中还介绍了常......
随着网络相关技术的发展,越来越多的信息尤其是文本相关数据资料迅速增长,人们需要在海量的信息中及时获取有用的或者自己感兴趣的内......
随着通信技术和计算机技术,尤其是Internet的飞速发展,各种各样的信息成几何级数增长,作为传统的信息载体,文本信息更是如此。数据挖掘......
随着当今世界逐渐从信息化转型为数据化,模式识别和数据挖掘等领域面临越来越大的挑战。爆炸式增长的数据量使得特征选择过程成为大......
随着网络信息技术的迅猛发展,人们被海量数据淹没,必须找到有效的方法,自动的分析数据、自动对数据分类、自动对数据汇总、自动的发现......
领域术语是反映领域特征的词语,可以从一定规模的语料中自动抽取。领域术语自动抽取是自然语言处理中的一项重要任务,可以应用到领域......
本文在分析特征选择相关性质的基础上,研究并设计了多种环境下特定的特征选择算法,而这些也是目前特征选择的研究热点。 主要结论......
随着入侵检测等高维数据机器学习问题的不断涌现,已有的特征选择算法和机器学习算法面临着严峻的挑战,迫切需要准确性和运行效率等......
随着Internet的迅速发展和日益普及,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需......
特征选择是模式识别技术的关键技术环节之一。特征选择按照和后续分类算法的结合方式可分为嵌入式、过滤式和封装式。本文主要研究......
模式识别的主要任务就是利用样本中的特征,将样本划分为相应的模式类别。通常情况下,样本特征中包含了足够的类别信息,才能通过分......
在自然语言处理中,统计方法占据着重要的地位。通过自动或半自动方式从大量数据中学习语言的统计知识,这类方法可以有效地对各种语言......
多标记学习问题中每个样本可以同时和多个标记相关联,因此比传统的单标记学习有更广的应用空间,并受到越来越多研究者的关注。然而......
随着计算机网络技术的飞速发展,人们的工作以及日常生活越来越依赖于计算机以及网络。各种经济信息、军事信息、个人信息也随着网......
在信息时代,数据是企业重要的资产,防范数据资产泄漏是意义重大的课题。本文立足于数据防泄漏保护的研究,旨在构建一个检查文件安......
随着信息化社会的发展,网络的不断普及,中文信息处理技术的应用越来越广泛。中文分词技术作为中文信息处理技术的基础,已经成为制约中......
互联网时代,网络已成为最大的信息聚集地。特别是因特网的快速发展,信息及电子文本数目迅速增加。据统计,互联网中80%的数据是以非......
近年来,在现实生活和科学研究中产生大量的高维海量数据集,使得传统分类器面临着前所未有的挑战。而大量研究表明,特征选择通过剔除不......
现实问题中的数据通常是高维的,其中存在大量的不相关和冗余的特征,这给传统的学习算法带来了巨大的挑战。特征选择就是在这种情况......
随着计算机网络的爆炸式发展,如何保障网络安全成为人们亟需解决的问题。入侵检测系统在网络安全方面发挥的积极作用使它成为人们关......
膜蛋白的类型对于了解其结构和功能具有重要意义。随着后基因组时代的到来,传统的通过生物实验进行膜蛋白类型预测的方法逐渐不再......
随着移动互联网的发展,移动端应用程序呈现爆炸式增长。Android作为一个开源操作系统被大量手机厂商定制化使用,也正是由于其开放......
照顾老人是世界各国都面临的问题,特别是老龄化不断加剧的国家,这一问题显得尤为突出。如何在老年人摔倒时及时报警,是保障其生命......
特征选择在入侵检测前对数据进行预处理,一方面找出富含信息的特征子集,另一方面提高分类的精度和效率。本文提出一种入侵检测特征......
近年来我国石油产量跟不上需求,供需矛盾进一步凸显,导致石油的对外依存度已经连续几年超过警戒线,为了缓解供需矛盾,石油的增储上......
特征选择是从原始数据特征集合中选择最优特征子集的过程.特征选择通过去除冗余和与问题不相关的特征项以提高信息处理的精度......
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇.本文通过采用跨语言词相似度计算将单语广义向量空间模型(Ge......
基因表达谱数据具有高维度、低样本和连续型等特点,建立肿瘤分类模型的关键在于准确找出一组能够决定癌症基因样本类别的特征基......
本文就无线局域网常见的DoS攻击方式展开研究,提出了一种基于信息增益特征选择和支持向量机的攻击检测算法.该算法通过信息增益特......
根据中文新闻报道的特点,分析了信息增益的缺陷,对比了文本证据权,并用文本证据权的算法思想改善其缺陷,提出了基于两层阈值的特征......
本文研究了基于驾驶行为的驾驶人疲劳状态检测方法。通过分析驾驶人在不同疲劳状态下的方向盘操作参数和车辆状念参数特征,提取......