潜在语义分析相关论文
近几年来,文本聚类技术作为机器学习领域一种无监督学习的方法,也越来越成为数据挖掘领域备受关注的技术之一。将小规模的文本数据聚......
基于互联网金融提供的客户借款描述,通过潜在语义分析挖掘借款描述文本内容的主题,运用二元分位数回归分析借款描述对互联网金融信用......
随着计算机和网络技术的不断发展,以自然语言为特征的领域文本信息不断喷涌,这些文本信息是进行科学研究、企业竞争情报研究的宝贵......
快速、准确获取BBS论坛主题已成为目前web信息获取中一个极其重要的研究方向。针对已有的BBS论坛中有影响力主题计算方法的不足,提......
本文提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它借助于潜在语义分析理论,对大量问答句子对语料统计分析,......
当前对于社交网络“标准偶像”现象和机理的研究,仍缺乏足够重视、专门实证探讨和理论自觉。明确提出“标准偶像”的理论概念,并进......
语言处理的最核心问题是语法和语义消歧的问题.本文首先介绍了人类探索自然语言理解研究以来的成就和不足,并描述了基于潜在语义分......
基于近红外光谱(NIR)和潜在语义分析(LSA)方法,对5种典型壮阳中药材进行分类鉴别研究。利用潜在语义分析对光谱预处理后的5种壮阳中药材......
运用查询扩展中的局部反馈技术和伪文档反馈技术,提出一种面向微博的查询扩展方法。将候选词分为3个层级进行考察,分别为主题-词语......
社会标注系统中用户生成的标签具有随意性和弱关联性,这将导致标签推荐的精确性降低。本文基于加权元组潜在语义的三维张量结构模......
【目的】利用关联数据的机器可读、语义表示、关联描述和网络资源属性的优势,弥补学术资源网信息组织的不足,为相似文献发现提供支......
本文提出潜在语义分析的Web文本分类方法,该方法认为在词汇之间,词汇与文本之间存在着某种上下文的关系,多篇文本与多个词汇可以由......
互联网的迅猛发展和广泛普及,使人们可以方便地从网络上获得信息。但是网络信息的爆炸性增长,又使得人们准确、快速地获得价值信息......
学位
面对当今日益增多的在线文本,如何压缩信息量,从而帮助人们快速有效的选择和利用感兴趣的信息,成为文本处理领域所关注的焦点。文本摘......
随着互联网的发展,人们既感到信息资源十分丰富,又感觉想找到所需的信息相对较难.原因之一是现有的信息系统还没有能够对信息资源......
随着Internet的快速发展,特别是WWW的飞速发展,网上信息资源越来越丰富,网络已经成为了一个全球最大的分布式的信息库,为信息共享、资......
互联网技术的飞速发展,网络上文本信息爆炸式增长给信息检索技术带来了巨大挑战,人们越来越难以快速准确地从网上检索到自己真正想要......
随着互联网的发展,当前出现的Web标准如WSDL,SOAP,UDDI,DAML-S,使得Internet成为一个异构的、具有互操作性的Web服务的海洋,从而使应用程......
随着计算机网络、数据库、多媒体等技术的飞速发展和日益普及,因特网上的可用信息以惊人的速度增加,仅Google搜索引擎能索引到的网页......
机器学习通过研究计算机如何模拟人类的学习行为以获取新的知识或技能,重新组织已有的知识结构达到不断改善自身性能的目的。但是......
现今存在着大量丰富的语音信息,需要对其进行有效地利用和开发。语音文档自动摘要就是能满足这种需要的一项很实用的技术,它能方便......
一篇文档通常涉及多个子主题,然而传统的文本处理系统如信息检索和文本摘要以整篇文档作为基本处理单元,隐性假设文档主要讨论一个主......
数据库关键词的语义检索作为数据库关键词查找的一个重要研究方向,在近几年已经得到了广泛关注。与精确查询相比,语义检索能够发现......
随着网络技术的发展,以数字形式存储的文本数量出现了爆炸式的增长。为有效地组织它们以满足需求,文本聚类技术应运而生。传统的文......
随着Internet技术的迅速发展,Web资源的更新频率令人瞠目结舌。然而,在Web信息资源迅猛发展的同时,人们不能忽视信息极大丰富而知......
浩如烟海的互联网信息推动了搜索引擎的普及和应用,同时也促进了搜索引擎技术的蓬勃发展。当今搜索引擎的各项技术日趋成熟,学术界......
自动文本分类是信息检索领域的基本任务之一。随着互联网上的信息量呈爆炸性增长,人们很难从大量的文本信息中迅速有效地提取出所需......
随着互联网的发展,人们在习惯于通过互联网来获取信息的同时,也发现由于互联网中信息量的庞大及其无组织性,如何高效地取得有用的......
大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition,LVCSR)是语音识别研究的重点和难点之一,其涉及了声学模......
专利文献包含重要的研究成果,内容广泛新颖,技术细节描述详细,是世界上最新技术信息的重要来源。专利文献的有效分析对提高企业市......
图像场景可能由多个对象(比如:草地,马路,建筑物)所组成。给定一组图像,我们的目标是利用无监督方法发现每一幅图像所包含的对象,然后根......
潜在语义分析(LatentSemanticAnalysis,LSA)是一种通过统计分析挖掘出文档和词语之间潜在含义的经典算法,最初用于解决信息检索中的......
全国大学生英语四六级网考在教育部的推进下渐渐成形,四六级作文的自动评分成为一个随之出现的新课题。以往四六级作文阅卷采用人工......
随着Web应用的蓬勃发展,现实世界中存在大量的对象,它们相互之间存在各种各样的交互关系,形成一个庞大的、相互联系的复杂网络,我......
随着网络信息技术的发展,互联网数据及资源大幅增加,并呈现出海量特性。为了有效地管理和利用这些海量分布的信息,基于内容的信息......
当前对于社交网络“标准偶像”现象和机理的研究,仍缺乏足够重视、专门实证探讨和理论自觉.明确提出“标准偶像”的理论概念,并进......
随着多媒体技术的发展,数字图像以其便于传输与保存逐渐融入人们的日常生活中,成为人类信息获取的重要来源,视频监控系统也得到了......
随着互联网络的普及,人们获取信息的方式逐步从报纸、广播和电视等传统媒体向互联网转变。越来越多的人热衷于借助论坛、博客和微......
动态文摘的研究对象是多文档集合,这些文档中的内容是随着时间而更新演化的。但是动态文摘中存在高冗余、新颖信息丢失等问题,严重......
随着GPS/北斗定位技术、车联网技术、5G等先进前沿信息技术的飞速发展,海量的交通时空轨迹大数据得到了迅速积累,其蕴含着极其丰富......
将排序学习的方法应用于构件检索的研究中,首先,采用刻面描述的方法对构件进行全面的描述,并通过word2vec模型和权重设定的方法对......
标签标志着在web2.0时代用户从被动的消费者变为主动的信息创造者,用户可以自由的在网络上创建和使用代表自己意愿的任意标签。如......
提出了一种基于WordNet本体标注和概率潜在语义分析(PLSA,ProbabilisticLatent Semantic Analysis)的语义Web服务发现方法OntoPLSA......