基于半监督学习的短文本分类方法

来源 :山东理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:clhsmith001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度.
其他文献
在三维直接边界元法分析中,几乎奇异积分的计算是一个重要的问题.对此,采用作者之前工作中提出的一种有效算法,使用高阶几何单元来描述几何边界,构造了新的距离函数,拓展原有的指数
提及"后进生",许多老师都会愁眉紧锁,不知要怎么做才能令"后进"前进。教育家颜元说过"数子千过,莫如奖子一长",所以,我们要审时度势,处理好"褒"与"贬"的关系,要善于运用"显微镜"不断挖掘
选取乙醇和水作为溶剂萃取茴香中的茴香醛,探究了不同外在因素对提取效率的影响。实验结果表明,反应介质为6 mol/L的HCl,显色剂用量为2 mL,反应时间20 min,反应温度为室温时
通过对建国以来宁夏平原春小麦4次更新品种的主要农艺性状的演变规律研究表明,宁夏平原春小麦籽粒和生物产量有了明显提高,随着品种的更替,收获指数、每穗粒重、每穗粒数均呈