ISOMAP在中文文本聚类分析中的应用

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:tonight000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类中,文本特征向量的高维性使得对样本统计特征的评估十分困难,所以有必要进行有效的维数约简。ISOMAP是一类新近出现的非线性维数约简方法,可以有效地对文本特征空间进行降维处理,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,将高维的文本特征数据映射到2~3维的低维可视化空间上,达到数据降维目的,实现文本数据特征可视化,并在一定程度上解决聚类数问题。最后通过实例,验证了方法的可行性。
其他文献
利用振动筛的运动微分方程和两激振器的回转运动方程,建立了双轴二倍频自同步振动筛同步相位差角的微分方程;通过研究该微分方程状态方程的平衡点,提出了振动筛实现二倍频自