基于机器学习的文本聚类描述算法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:rnimaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释。标注文本集合聚类后生成的类簇被称为聚类描述问题。聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务。针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法。实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法。
其他文献
为了实现电网信息系统中数据的标准化和规范化,便于统一管理。本文基于公共模型设计了一种非结构化数据模型。首先文章介绍公共模型,其次说明了非结构化数据模型的设计原则、
研究了不同铁矿粉对水分的吸收性能,通过自制吸水装置测量了各种矿石的吸水速率曲线。定义矿粉亲水性H为:吸水速度k与最大吸水百分含量的乘积,以此表征铁矿粉的吸水能力,效果
长期以来,德国一直是国际上公认的房租和房价保持平稳合理的典范国家。然而,从2008年金融危机开始,由于欧洲央行长期实行零利率政策,再加上在整个欧盟范围内德国房地产市场一
目的探讨局部枸橼酸抗凝在血液净化中的临床疗效。方法选择我院2015年5月—2018年6月收治的行血液净化患者262例作为研究对象,其中行局部枸橼酸抗凝212例为观察组,无肝素或小
7月11~12日,中国合格评定国家认可委员会(CNAS)委派评审组对四川省畜牧科学研究院科技型企业四川省畜科饲料有限公司检测中心进行了现场评审。四川省畜牧科学研究科院动物营
“以秸秆换肉奶”工程是将秸秆加工贮运、牛羊养殖基地、有机肥生产、粪污处理净化等进行一体化处理,实现农业生产生态循环、绿色环保、收益明显的系统工程。实施“以秸秆换
研究前沿(research fronts,RF)是指某一时刻正在关注的热点领域和涌现的具有发展潜力的研究方向。通过对研究前沿的研究,可以为研究人员提供所关注领域的研究动态,找到具有价值