【摘 要】
:
在当前数据模式识别理论和方法研究的基础上,针对在无监督聚类和有监督分类两种识别方法在独立用以进行样本分类,特别是给无类标志样本分类时存在的不足之处,提出了一种先聚
论文部分内容阅读
在当前数据模式识别理论和方法研究的基础上,针对在无监督聚类和有监督分类两种识别方法在独立用以进行样本分类,特别是给无类标志样本分类时存在的不足之处,提出了一种先聚类后分类的结合应用思路(C2CMA),将聚类方法和分类方法整合起来解决模式识别问题;并提出一个称为数据模式识别整合框架(DPRIF)的功能、方法整合策略,用以在无先验类别信息的条件下实现数据模式发现和解释,构造具备较高稳定性和分类精度、可用于判断和预测新数据的分类器。在DPRIF整合策略指导下构建了一个整合的SOFM-SVM模型,对该模型从运作机制、数据接口、功能扩展几个方面进行分析和改进:引入PCA方法进行数据降维和特征提取,用以加强聚类解释;结合统计聚类中的聚类误差概念定义一个聚类数有效性指标,利用SOFM算法中间结果进行指标求解,以筛选出有效或最佳聚类数;提出一种新的噪声识别算法(Anti-NO算法)用于对样本中的异常数据进行甄别和过滤;利用SVM模型的中间结果提取分类边界数据;进一步充实了包括模式类、噪声集和边界在内的模式识别成果。最后将该整合模型应用于上市公司信用模式识别的实例,证明该整合策略和模型对于解决C2CMA数据挖掘任务是可行有效的,同时为定量研究证券信用模式分类问题做出新的探索。
其他文献
1991年7月2日。沈阳汽车齿轮厂党委决定,将52岁的企管办主任李振龙调到九车间任专职党支部书记。消息一传出,一些好心人便劝李振龙:“当车间支部书记,一没权,二没钱,趁早打
由清华大学史静寰主持的全国教育科学“十五”规划教育部重点课题“二十世纪西方教育史学理论与研究范式研究” (DAA010146),日前通过了经全国教育科学规划领导小组办公室组
由湖南铁道职业技术学院信息工程系主任陈承欢主持的湖南省教育科学“十一五”规划2006年度重点课题“基于岗位需求的高职软件专业模块化课程体系的构建” (课题批准号:XJK06
甘露糖结合凝集素又称甘露糖结合蛋白(MBP),是Ca2+依赖型(C-型)动物凝集素家族一员.MBL可通过不同机制激活补体参与补体系统的经典与替代途径,又称凝集素途径.本文综述了近年来MBL结构与功能、MBL缺失等的研究进展,重点阐述了MBL缺失与自身免疫病的关系.
本文通过对国内外电影企业发展的外部动因和内部动因进行分析,提出了战略主导型、政策主导型和战略政策互动型三种动因模式。针对中国电影企业政策动因过强、战略动因不足
在全球气候变暖的背景下,发展低碳经济正在成为各国的普遍共识。在城镇化进程不断加快的今天,作为低碳城市最活跃的组成部分——低碳社区建设对发展我国低碳经济以及建设和谐
随着我国社会经济的快速、全面发展,林业建设发挥了独特的作用,但随之而来的生态工程建设方面依旧存在诸多问题,这就要求,我们加大对林业行业的研究,提高对相关资源的开发、管理和
中国煤层气资源丰富,开发前景巨大。为促进中国煤层气开发,煤炭部煤层气信息中心和美国环保局合作完成了《中国煤层气开发前景联合报告》。该报告全面评价中国煤层气资源和开
车辆路径问题(Vehicle Routing Problem,VRP)是物流运输研究领域内一个非常重要的问题。传统VRP研究都是静态模型,即在安排车辆路径之前所有的相关信息都已经知道并且确定。这
“一夜暴富”、“海外上市”、“获利丰厚”……当这些诱人的话语在你耳畔响起的时候,投资者千万不要被突然从天上掉下来的馅饼所欺骗。前一阵被媒体广泛报道过的“原始股”