面向代价敏感的多标记不完备数据特征选择算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:xjwyx770729
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代价敏感下的特征选择是机器学习和数据挖掘领域的重要研究内容,目前基于代价敏感的特征选择研究主要是面向单标记的数据,由于在许多应用领域数据往往是多标记连续型数据,且在数据获取过程中由于技术或成本限制导致数据呈现出不完备性.为解决上述问题,提出了一种基于测试代价的多标记不完备数据特征选择算法.首先,算法利用粗糙集模型计算多标记不完备数据下的邻域粒度,并用均匀分布和正态分布两种分布函数计算每个特征的特征代价;然后,提出了一种基于测试代价的特征重要性计算方法,并在核特征的基础上,设计了启发式的特征选择算法;最后,通过在Mulan数据集上的实验结果进一步验证了算法的有效性和可行性.
其他文献
中国是一个以农业为主的国家,长江流域的稻农主要以稻作为主要劳作方式,年复一年,形成了共同的音乐表现形式——田歌。在长江流域各个省的《中国民间歌曲集成》中,田歌的末尾音调
目的:观察星半通膈散对中晚期食管癌痰瘀互结证患者的临床疗效。方法:将符合纳入标准的40例中晚期食管癌痰瘀互结证患者随机分为两组,每组各20例。治疗组用星半通膈散、对照组用
中华人民共和国劳动和社会保障部令 第26号 第一条 为维护台湾居民、香港和澳门居民中的中国公民(以下简称台、港、澳人员)在内地就业的合法权益,加强内地用人单位聘雇台、港、
2月8日,中共中央政治局常委、国务院副总理张高丽到国家统计局调研,并主持召开了贯彻落实《关于深化统计管理体制改革提高统计数据真实性的意见》座谈会。他在传达习近平总书
随着时代发展,00后大学生已经逐渐发展成为我国接受高等教育的主要对象,而在网络时代背景下,如何对00后大学生实施网络意识形态安全教育,成为教育领域研究的重点课题。该文在
随着我国社会的快速发展,国有企业对于资金管理的效率越来越重视。由于经济的市场化成度不断提升,传统的资金管理模式,已经逐渐不适应国企资金运营的需求。对资金管理制度进行深
随着核科学的发展,核技术不仅在国防工业,而且在民用、农业、医学等诸多领域都得到广泛应用。核能作为“清洁高效能源”在世界各国能源构成中所占的份额不断 With the deve
本文按可比的统计口径,对中美服务业结构进行了详细比较。以美国相同经济发展阶段服务业发展情况为参照,我国服务业各行业发展水平体现为“二高、三相当、七低”。参照美国服务
著作权法修改草案的公布引起产业界极大的反响,特别是录音制品的法定许可甚至成为一个娱乐事件。论述了录音制品法定许可制度的合理性及其运作机制,以著作权功能分析为线索,
动画民族化的探索一直是中国动画发展的重要课题。人们反复研究、反复探索,试图寻找一种古典与现代相结合的表现模式。事实上,中国民族化的动画,绝不是简单地用三维展示一些