基于局部线性判别嵌入算法的中文文本分类研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:wozhixiangxiazai1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
其他文献
我自豪我们是千年文化之海  我骄傲我们是百年艺术之淀  海淀是一颗璀璨的艺术明珠  为首都北京平添风情万千  闻名瑕迩的西山八大水院  曾让金章宗忘返流连  元世祖忽必烈夜宿海淀  瓮山湖水涤尽战袍的硝烟  清代皇帝经营200年的三山五园  为海淀移来一座锦绣江南  纳兰性德一生钟情海淀  《吟水词》就诞生在渌水亭畔  文学大家曹雪芹最爱西山  一部《石头记》唱尽人生苦辣酸甜  当世界迈进21世纪