词权重相关论文
传统的基于"词袋"的文本表示方法假定词的权重只和它本身的出现频率有关,而忽略上下文信息.本文提出了一种基于上下文的图模型文本......
互联网逐渐成为记录人们生活和工作的信息载体,给人们的生活和工作带来了获取信息的便利,同时在被使用的过程中产生了大量的文本数......
本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF,进一步总结了两种典型的分类算法-Bayes判别准则与向量空间模型,并提出结合......
基于机器学习的垃圾邮件过滤方法相较于传统方法有更好的效果。文本表示方法的好坏会对分类算法产生影响。加权LDA模型在传统LDA模......
本文提出一种基于Shannon信息熵的向量空间模型(VSM)中的词权重算法。同时组合词与文献的相关权重的经典计算方法IDF(Inverse Document Frequency),进一步总结了向量空间模型......
对相似关键帧匹配中存在的低效率及无法很好反映语义特征的问题进行了分析,提出了基于词袋模型的关键帧描述方法,并进一步考虑了视......
语言模型是自然语言处理领域中的基础任务之一,同时也被应用在语音识别、对话系统、机器翻译、句法分析等多个文本处理任务上。随......
传统的句子相似度计算方法只关注句子的某个特征,导致召回率和准确率的不均衡。针对该问题,提出一种基于多特征的句子相似度计算方......
为提高自动文摘的质量,提出一种词句协同的自动摘要提取算法(F-CoRank)。在传统词频的基础上,提高与标题相似的特征词的词频,得出......
社交媒体平台,如微博、推特等,以其操作便利性、信息共享性、用户互动性、话题丰富性以及更新即时性等特征,吸引着大量的用户在平......