海量文本相关论文
文本的自动化聚类是文本数据的分类处理和自然语言处理中的一项关键技术,在文本文献的自动分类中也是一项非常重要的应用。近代以......
[目的/意义]以大数据环境下的文本情感分析这一特定任务为目的,对规模适配问题进行研究,为情报学领域研究人员进行大数据环境下数......
对海量文本数据的查询检索,目前并没有高效方便的方法,传统方法一般是将其导入到数据库中再结合SQL语言进行处理,费时费力.本文基......
传统多类文本多分类算法存在计算量大和训练时间长的问题,为此利用黄金分割(Golden Selection,GS)和支持向量域描述(Support Vector D......
研究基于关联度挖掘的海量网络文本挖掘方法;随着计算机和网络技术的快速发展,网络上的文本呈现海量增长的趋势,传统的网络文本挖掘方......
海量文本快速索引是云检索系统的一个难点,而分布式索引程序的开发难度较大。文中提出了一种基于MapReduce的分布式索引方法,通过......
文本分类/聚类是机器学习、信息检索、知识管理等多个领域的核心任务。由于近年来Web文本数据呈指数式增长,要高效实现文本分类和聚......
关联挖掘是一种重要的数据分析方法,提出了一种在全置信度下的增量队列关联挖掘算法模型,在传统的FP-Growth及PF-Tree算法的关联挖......
随着互联网的快速发展和信息量的急剧增加,如何快速、有效的获取信息越来越受到人们的关注。传统的自然语言处理方法已经逐渐不能......