词语权重相关硕士博士期刊学术论文

词语权重相关论文

基于词语权重分析的中文文本相似检测技术研究

在当今互联网环境下,愈来愈多的文档出现被随意复制、修改、变换格式、替换同义词等现象,这将导致大量核心内容甚至全部内容一样的......

学位

词语相似度计算词语权重 TF-IDF Simhash 文本相似

智能健康知识问答系统的研究与实现

随着信息技术的发展,人们已习惯于从互联网上获取各类信息,这得益于搜索引擎技术的发展。然而,搜索引擎仍然有一些问题没有解决。......

学位

问答系统中文分词相似度语义推理 AIML

文本分类中词语权重计算方法的改进及应用

互联网的发展和信息技术的进步,带来了信息量的猛增,人们很难在浩瀚的信息中找到真正需要的信息,虽然各种搜索引擎的出现在一定程......

学位

文本表示特征向量向量空间模型 TFIDF 遗传算法

基于类别词语权重的MBL改进方法

记忆学习方法(Memory-Based Learning(MBL))将存储的训练数据作为获取的知识来使用,并通过相似性比较来完成分类任务,克服了词语一......

期刊

自然语言处理基于记忆的学习方法可信距离词语权重

面向审查任务的中文专利检索模型与实验

针对中国国家知识产权局专利审查中的专利检索任务,设计了一个两步专利检索模型:第一步进行布尔初步检索;第二步采用向量空间模型......

期刊

专利审查专利检索词语权重相似性 patent examination patent search term weight similarity

基于特定领域的加权语义相似度算法研究

信息检索模块是自动问答系统中的主要组成部分.实现问题检索的关键问题是句子相似度计算问题.提出的基于特定领域的加权语义相似度......

期刊

自动问答系统信息检索相似度语义词语权重 automatic question-answering system information retriev

改进的频繁词集短文本特征扩展方法

针对短文本结构短小、语义不足、难以建模的特点,提出一种利用改进频繁词集进行短文本特征扩展的方法。通过计算单词集的支持度和......

期刊

词语权重信息增益频繁词集关联关系非负矩阵 term weight information gain frequent term set inciden

基于句子权重和篇章结构的政府公文自动文摘算法

提高文摘自动生成的准确性,能够帮助人们快速有效地获取有价值的信息。本文根据政府公文结构性强的特点,提出一种基于句子权重和篇......

期刊

政府公文自动文摘词语权重句子权重篇章结构

个性化服务中用户近期兴趣视图的生成

随着时间和环境的改变,Web用户的兴趣也会随之改变,在信息服务中应该能捕获到用户的这种近期兴趣变化以便能为用户提供更好的个性......

期刊

个性化服务词语权重信息量行为分析回归分析用户近期兴趣视图网页 personalization term-weighing information q

利用上下文提高文本聚类的效果

传统文本聚类的向量空间模型中,认为词的权重只和词频有关,而与词语出现的上下文无关。本文介绍了如何借助按词语之间关系组织的本......

期刊

计算机应用中文信息处理文本聚类上下文词语权重本体论词典

面向产品评论识别的研究

在垃圾评论问题日益严重的今天，本文主要对产品的评论识别进行研究。在分词技术上，对逆向最大匹配算法进行改进，将中性高频词及无用词......

期刊

产品的评论识别分词技术词语权重相似度

文本分类中词语权重计算的改进

文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型（Vector Space Model）中的TF．1D......

期刊

文本表示向量空间模型词语权重信息增益

一种Spark GraphX框架下的关键词抽取方法

TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模......

期刊

Spark GraphX 关键词提取图排序词语权重

看过本文同时还关注