基于局部线性判别嵌入算法的中文文本分类研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户：wozhixiangxiazai1

【摘要】

：

流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判

【作者】

：

范少萍李迎迎郑春厚

【机构】

：

中国科学院国家科学图书馆兰州分馆,中国科学院资源环境科学信息中心,中国科学院大学,曲阜师范大学信息技术与传播学院

【出处】

：

情报理论与实践

【发表日期】

：

2014年02期

【关键词】

：

流形学习文本分类算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。

其他文献

迎接中国城市文化的灿烂明天

我自豪我们是千年文化之海　　我骄傲我们是百年艺术之淀　　海淀是一颗璀璨的艺术明珠　　为首都北京平添风情万千　　闻名瑕迩的西山八大水院　　曾让金章宗忘返流连　　元世祖忽必烈夜宿海淀　　瓮山湖水涤尽战袍的硝烟　　清代皇帝经营200年的三山五园　　为海淀移来一座锦绣江南　　纳兰性德一生钟情海淀　　《吟水词》就诞生在渌水亭畔　　文学大家曹雪芹最爱西山　　一部《石头记》唱尽人生苦辣酸甜　　当世界迈进21世纪

期刊

城市文化元世祖忽必烈《石头记》纳兰性德清代皇帝文学大家曹雪芹世界先进文化三山五园水词

基于局部线性判别嵌入算法的中文文本分类研究

其他学术论文