论文部分内容阅读
案例库的建立和案例检索是案例推理中最关键的两个问题,它们直接影响到案例推理精度与速度。现有的案例推理方法主要是对案例检索过程进行研究,但是好的案例库的建立不但可以提高案例推理的准确率,还可以提高案例推理的速度。然而在已有的案例检索问题的研究上,采用的距离测度都需事先假定属性间相互独立,对具有较强相关性的数据进行相似度计算时,缺乏理论依据。综上所述,建立一个好的案例库以及实现对具有相关属性的案例进行推理具有重要意义。针对上述问题,本文分别对案例推理中的案例库的建立和案例检索过程进行研究,探索高效的案例库建立方法及准确度高的案例检索方法。对于案例库的建立过程,本文建立模糊C均值-神经网络模型,进而提出基于模糊C均值与神经网络的案例推理方法。首先,通过利用模糊C均值方法对原有案例库进行预处理,将聚类正确的案例存入到案例库中,将聚类错误的案例去除掉,由此去除冗余案例,实现对原案例库进行精简,得到高效的案例库,由于案例库中的案例数减少,因此,不但节省了案例库的存储空间,也可以提高案例检索效率。得到精简的案例库后,利用神经网络方法确定案例的各个属性的权重,从而在一定程度上提高案例检索精度。对于案例检索过程,本文在已有的自学习距离测度基础之上,提出基于微粒群的案例检索方法。首先确定一个目标函数,再利用微粒群方法寻优得到新的距离测度,并将此距离测度应用于案例检索过程。微粒群自学习距离测度不需要事先假定案例中各个属性间是相互独立的,考虑到了属性间的相关性,它通过确定一个非奇异、非对角型权矩阵来体现各属性间的相互关系,与传统距离测度相比,考虑到了各属性间的相互关系,因此,更具合理性,这为具有相关属性的案例推理提供了一定的理论依据。本文最后将所提出的案例检索方法应用于一个复杂无规律的问题——旱涝灾情判断问题上,为灾情评估以及灾后重建提供了一定的理论依据。本研究以UCI数据以雨洪数据为研究对象,对新案例库的建立过程和案例检索算法进行仿真分析,并对各种方法的检索精度进行比较。