【摘 要】
:
相似性度量是聚类分析的重要基础,如何有效衡量类属型符号间的相似性是相似性度量的一个难点.文中根据离散符号的核概率密度衡量符号间的相似性,与传统的简单符号匹配及符号
【机 构】
:
中国西南电子技术研究所,福建师范大学数学与计算机科学学院
【基金项目】
:
国家自然科学基金项目(No.61672157);福建省自然科学基金项目(No.2015J01238)资助~~
论文部分内容阅读
相似性度量是聚类分析的重要基础,如何有效衡量类属型符号间的相似性是相似性度量的一个难点.文中根据离散符号的核概率密度衡量符号间的相似性,与传统的简单符号匹配及符号频度估计方法不同,该相似性度量在核函数带宽的作用下,不再依赖同一属性上符号间独立性假设.随后建立类属型数据的贝叶斯聚类模型,定义基于似然的类属型对象-簇间相似性度量,给出基于模型的聚类算法.采用留一估计和最大似然估计,提出3种求解方法在聚类过程中动态确定最优的核带宽.实验表明,相比使用特征加权或简单匹配距离的聚类算法,文中算法可以获得更高的聚类精度,估计的核函数带宽在重要特征识别等应用中具有实际意义.
其他文献
高速公路绿化对改善高速公路生态环境,保证行车安全,美化道路景观有着重要作用。高速公路环境的特殊性又严重影响了绿化苗木的成活、生长,成形。本文作者根据实践和体会,浅谈一些
运用“水平切片淀粉凝胶电泳等位酶分析”方法 ,对国家一级珍稀濒危保护植物望天树 (Parashoreachinensis)进行了遗传多样性和居群分化的研究 ;通过对分布于滇南、滇东南和桂
行业领先的中文版和日语版Proficy^TM HMI/SCADA iFIX 4.0现已上市 iFIX可观察自动化环境,实现功能性的增强。
云南某选厂采用浮选—重选工艺回收铜、铅、锌、锡等矿物,但矿石过粉碎现象严重,产品品位和资源回收率较低。根据矿石性质和市场行情制定技改措施,使矿石过粉碎的现象大大降
漏电断路器(又称带剩余电流保护塑壳断路器)不仅具有过载、短路保护功能,而且还具有防止人身触电和漏电火灾危险功能。由于漏电断路器事关生命与财产安全,对其进行可靠性研究