论文部分内容阅读
基因芯片是基因研究必不可少的工具,通过分析基因芯片数据可以获得有关生物学的大量宝贵信息。聚类分析是基因数据分析中的一种重要手段,本文主要内容包括基于划分的聚类算法的改进以及模式聚类的理论研究。
文中对基于划分的聚类方法主要探讨了两个问题。
首先,引入模糊聚类中的可能性聚类方法来对基因芯片数据进行分析。通过在可能性聚类的目标函数中添加聚类中心排斥项的方式,对一致聚类中心的缺陷进行有效的控制。
其次,目前已有的有效性函数指标只能用于FCM聚类,本文对可能性聚类的有效性度量问题进行了研究。提出在已有FCM有效性指标的基础上进行约束修正,将原来无关联的可能性隶属度附加上具有和FCM隶属度类似的关联性。改进后的有效性函数可用于可能性聚类的聚类结果。
本文对模式聚类进行了探索性的理论研究。总结目前模式聚类算法的特点,定义了一种具有普遍意义的模式及其规则函数,着重讨论了该定义形式下的模式相关性质及扩展运算,为多模式聚类的研究提供了一定的理论基础。