基于上下文相似度矩阵的Single-Pass短文本聚类

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wolfwang21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交网络已经成为人们信息交流的重要渠道和载体,形成了与现实世界交互影响的虚拟社会。众多的网络事件通过社交网络进行快速传播,可以在短时间内成为舆论热点,而负面事件会对国家安全和社会稳定造成冲击,从而引发一系列的社会问题。因此,挖掘社交网络中蕴含的热点信息,无论是从舆论监督方面还是舆情预警方面都具有重要的意义。文本聚类是挖掘热点信息的一种重要方法,然而,使用传统长文本聚类算法处理海量短文本时准确率将变低,复杂度急剧增长,从而导致耗时过长;现有的短文本聚类算法的准确率偏低、耗时过长。文中基于文本关键词,提出
其他文献
通过访问调查法、文献资料研究法对当前普通高校开设田径选项课所面临的困境加以分析,并提出了相应的对策.
随着公安教育的深化改革,警体教学的改革也迫在眉捷,二十世纪八九十年代的警体教学模式,已无法适应当前公安实践的要求,随着法律的不断健全完善,罪犯特点的暴力性、突然性、
随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,
随着我国经济发展的日新月异,国际间交流合作蓬勃发展,各高校也在国际文化交流合作中占据着重要位置。进入新世纪后,国家留学基金委,各个省级财政,各高校均大力支持在职教师
目前,执法层面上制止餐饮浪费的法律依据还很薄弱,我们在期待《反食品浪费法》出台的同时,也期待相关执法机制的跟进。北京市丰台区某餐厅服务员因制止顾客餐饮浪费反被指责
众所周知,经典粗糙集的不确定性来自于边界域,但是对于粗糙模糊集来说,其正域和负域中的元素存在不确定性,从而导致粗糙模糊集的不确定性不仅来自于边界域,还来自于正域和负
要想提高企业产品销量必须要打造优秀的销售工作队伍,提升销售管理水平,促使销售工作质量的提升。然而目前在销售管理过程中存在着较多的问题,需要企业能够结合问题实际制定
采用文献资料、数理统计和案例分析法,研究运动APP在桂林航天工业学院学生体育运动中的影响,分析运动APP的作用,就如何提高大学生课外体育活动的参与与影响提出依据。研究结
被动式设计作为被动式建筑的重要组成部分,很大程度上决定了被动式建筑的节能效果和居住舒适度。针对我国建筑被动式设计不足这一现状,本文对被动式建筑发展过程、设计理念、
社会主义市场经济发展,既给军队院校后勤保障提供了前所未有的机遇,也给院校后勤思想政治工作提出了一些新的要求。如何增强思想政治工作的有效性,保证后勤人员思想道德的纯