论文部分内容阅读
概念格是数据分析和知识提取的一种有效形式化工具,具有精确性和完备性等特点。粗糙集理论是一种处理不确定、不精确数据的数学工具。本文利用粗糙集理论中的上下近似集,描述和刻画概念格外延的不确定性,及其不确定分类规则挖掘方法进行了研究,从而使概念格具有表示不确定性知识的能力,因此对于提高概念格表示知识的能力,具有重要的理论和实际意义。主要研究工作如下:第一、提出了一种新的概念格结构:粗糙概念格RCL,及其构造算法CARCL。采用粗糙集上、下近似集,定义了概念格中内涵所拥有的两种外延,即上近似外延和下近似外延。对于给定粗糙概念格的内涵,其拥有的上近似外延具有不确定的性质,而下近似外延是精确的,这种结构体现了对象与特征之间的确定与不确定两种关系。最后,实例验证了算法CARCL的正确性、有效性。第二、提出了具有粗糙度的分类规则及一种基于粗糙概念格的分类规则挖掘算法EACR。首先,采用粗糙概念格的上近似外延和下近似外延,定义了分类规则的粗糙度,并利用粗糙度来描述分类规则的不确定性;其次,利用用户给定粗糙度阈值,给出基于粗糙概念格的分类规则挖掘算法EACR;最后,以离散化SDSS恒星光谱数据作为决策背景,实验验证了算法的正确性和有效性。第三、在上述研究的基础上,以VC++和Oracle9i为开发工具,设计并实现了粗糙概念格构造及恒星光谱数据分类规则挖掘原型系统,并对软件功能模块、体系结构及关键技术进行了详细描述。运行结果表明,该系统是可行的、有价值的,从而为实现恒星光谱数据自动分类提供了一种新途径。