基于特征偏好的XML文档聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cngd0613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档聚类在众多数据应用领域都具有重要作用.基于特征偏好的XML文档聚类算法是对XML文档进行特征选择,将XML 文档描述为n 维特征向量,再结合CFP(Clustering with Feature order Preference)算法,根据特征偏好为其赋予权重,每次迭代聚类过程中进行权重的更新.实验结果表明当CFP 算法中的特征偏好权重和XML文档向量化时所用的层次权重设定相结合时,可弥补XML 文档向量化时的弊端,提高了XML 文档聚类的精度.
其他文献
梨网蝽,又名花网蝽,军配虫,属半翅园,网蝽科,俗称花编虫.
按1SiO2:0.35TBAOH:25H2O的摩尔比,170℃水热晶化48h得到微孔分子筛MEL,再按n(SiO2):n(CTAB):n(H2O):n(NaOH)=1:0.45:60:0.48的摩尔比,配成MCM-48的悬浮液,将合成的MEL加入MCM-48的溶液中,80℃水热晶
1震惊世界的克隆"多利"1997-02-27,英国<Nature>杂志,报道了英国罗斯林研究所Roslin Institute,Uk的威尔穆特(I.Wilmut)博士及其同事的题为"从胚胎和成年哺乳动物细胞繁衍后
南方梨近年来发展速度很快,但由于南方梨绝大多数是砂梨系统的品种,果实成熟时正值7~8月高温季节,果实呼吸作用大,养分消耗快,且易感病害而腐烂,因而,在常规条件下,梨采收后只
稀疏保持投影算法是一种无监督的全局线性降维方法,无法应对训练样本不足及类内样本间差异过大的情况。针对该问题,提出一种结合成对约束机制的近邻稀疏保留投影算法。利用近
FFT域参数立体声编码器在立体声参数提取和主声道编码时采用不同的时频变换,导致计算复杂度高。设计并实现了一种MDFT(Modified Discrete Fourier Transform,修正离散傅里叶变