【摘 要】
:
针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进
【基金项目】
:
湖北省教育厅青年基金(No.B200929001), 湖北民族学院博士基金,湖北民族学院青年基金
论文部分内容阅读
针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。
其他文献
针对ET指标的批量流水线调度问题,提出了差分进化调度算法。该算法采用基于实数的编码方式,利用最优目标个体的扰动产生变异个体,通过变异个体与目标个体的交叉产生试验个体,
针对K-means、FMC聚类算法容易陷入局部最优且对初始解很敏感的问题,提出了一种新的基于划分和连接度的聚类优化算法,并给出了具体算法实现,明显地避免了对初始化选值敏感性
提出了一种H.264视频在流媒体环境下的隐秘传输方法。该方法将秘密信息分段备份,用哈希函数置乱分段及备份的嵌入顺序,当秘密信息由于丢帧而损失时,用备份信息来恢复损失的秘
针对在实际应用中形式背景缺少函数依赖或被分析的关系是多维且冗余概念多等特点,提出了一种利用逻辑换算获取一致背景的新方法。通过利用逻辑换算产生的一致背景可减少与分
由于矿用光纤气体检测系统中线性最小二乘拟合方法只适用于光谱吸收率小于0.1的气体检测,针对光谱吸收率增大时气体吸收谱线与浓度的变化呈现非线性的问题,本文采用阻尼最小