【摘 要】
:
作为数据挖掘领域中一项重要的数据预处理技术,特征选择算法能够有效应对高维数据所带来的“维数灾难”问题.然而,如何对高维的混合数据进行特征选取仍然是当前研究的重点与难点之一.基于邻域关系的邻域粗糙集模型因其能够处理名词型属性和数值型属性并存的混合数据,已被成功运用于混合数据的特征选择.但现有邻域粗糙集对混合数据邻域关系的度量,仍然是基于等价关系的名词型数据划分和基于相似关系的数值型数据划分的简单融合
【机 构】
:
南京邮电大学自动化学院人工智能学院
【基金项目】
:
国家自然科学基金项目(62073173,61973151)?; 江苏省自然科学基金项目(BK20191376,BK20191406);
论文部分内容阅读
作为数据挖掘领域中一项重要的数据预处理技术,特征选择算法能够有效应对高维数据所带来的“维数灾难”问题.然而,如何对高维的混合数据进行特征选取仍然是当前研究的重点与难点之一.基于邻域关系的邻域粗糙集模型因其能够处理名词型属性和数值型属性并存的混合数据,已被成功运用于混合数据的特征选择.但现有邻域粗糙集对混合数据邻域关系的度量,仍然是基于等价关系的名词型数据划分和基于相似关系的数值型数据划分的简单融合,在利用模型划分的邻域空间和预定义的评价函数对高维混合数据进行特征选取时,适应性较差.为此,在邻域粗糙集模型的基础上,提出了一种改进的邻域空间构造方法,并设计了相应的邻域空间度量公式作为判别指标,自适应地调节邻域空间下邻域粒的大小?为了准确地表征高维混合数据邻域空间的判别能力,设计了一种考虑边界数据和邻域空间大小的评价函数?在此基础上提出了一种启发式的高维混合数据特征选择算法.通过UCI标准数据集验证了算法的有效性.
其他文献
采用CFD方法,对反应釜搅拌结构进行优化。对不同桨叶结构、安装尺寸以及挡板进行了数值模拟。结果表明:对所研究的硬脂酸钙反应釜,采用六弧叶圆盘涡轮(上桨叶)—三叶后弯(下桨叶)组合桨,釜内流动均匀,混合效果好。搭配传统壁挡板及十字形底挡板,可改善釜内的流动情况,增强上升流,避免物流沉积。通过进一步调整两桨叶间距、下桨叶离底间距等安装尺寸(桨叶间距385 mm,离底间距320 mm),可明显优化釜内搅
以五道岭隧道工程为背景,利用有限元软件对隧道穿越不同断层破碎带倾角进行分析,研究了不同断层破碎带倾角对隧道围岩位移的影响,研究结果表明:隧道围岩最大拱顶沉降量和周边收敛量都在断层破碎带处;断层破碎带倾角越大,隧道围岩越稳定。研究结果可为类似隧道穿越断层破碎带工程提供参考。
自2019年新冠肺炎疫情以来,教育学界对在线教育的态度,要从“新鲜感”向“新常态”转变,融合了“互联网+”“智能+”技术的在线教育已经成为中国高等教育和世界高等教育的重要发展方向。中国的在线教育大致可以分为三个阶段:第一阶段是以图片和文字简单地排列组合的幻灯片为核心;第二阶段主要以录播为核心;第三阶段则是直播教学为核心。作为信息时代的一种新兴传媒手段——网络直播被引入到教育领域,为当下火热的碎片化
安吉县,隶属于湖州市。从汉时建郡算起,有将近两千年的历史,其文化底蕴十分深厚。本文用社会语言学的视角对其村落名称进行深一步的研究,指出其村落名称的语音、语法、语义等特征,并从语言学角度出发对其村落名称中出现的问题提出意见。
立足高考试题的新变化,教师将重点放在高考读后续写的新题型上,这个重点考查学生语言能力的题型需要教师依托日常教学,助力开展读写结合教学,帮助学生在读中理清写作思路,在读中学习写作方法,在读中练习续写。文章将对如何开展有效的高中英语读后续写教学提出具体建议。
<正>作者回顾性分析了1 441例关节置换治疗移位的股骨颈骨折和734例内固定治疗无移位的股骨颈骨折患者资料。分析比较初始结果(2个月内病死率)和继续结果(包括再手术率和生命质量)。结果发现,病死率和再手术率关节置换组均低于内固定组,生命质量SF-12评分关节置换组高于内固定组。作者认为,对于没有移位的股骨颈骨折患者,
目的 通过调查研究中医院校医学生的职业认同感,从而了解其对医疗行业的职业认同程度,明确其在职业认同方面的具体情况,进而探讨提升中医院校医学生职业认同感的方法。方法 随机选取2020—2021年长春中医药大学在读的本科生、研究生120名进行调查研究,具体从职业认同感的三个因子和六个维度进行整理,进而得出调查结果。结果 中医院校医学生的职业认同感在职业价值认同、职业发展认同、职业能力认同方面均有不同,
针对不同电气输入特征量与电力系统暂态稳定关联程度不同以及当输入特征量受到干扰后评估准确率明显下降的问题,提出一种基于FisherScore特征选择的电力系统暂态稳定评估方法。设计一种面向电力系统暂态稳定评估二分类问题的样本特征量Fisher Score得分计算方案;通过Fisher Score分值排序有效筛选和区分重要特征与冗余特征、噪声特征与非噪声特征;将选择的电气特征量输入不同机器学习模型中进
连续搅拌反应釜(continuous stirring tank reactor,CSTR)是经典的化工设备,被广泛应用于化工过程。由于其具有较强的非线性和时滞性,传统的控制方法无法满足其跟踪控制的精度要求。针对连续搅拌反应釜提出一种基于广义状态相关探索(generalized state-dependent exploration,gSDE)的近端策略优化算法(proximal policy o