【摘 要】
:
随着互联网的发展,人们在习惯于通过互联网来获取信息的同时,也发现由于互联网中信息量的庞大及其无组织性,如何高效地取得有用的信息成为了一个亟待解决的问题。搜索引擎的
论文部分内容阅读
随着互联网的发展,人们在习惯于通过互联网来获取信息的同时,也发现由于互联网中信息量的庞大及其无组织性,如何高效地取得有用的信息成为了一个亟待解决的问题。搜索引擎的出现使这一问题得到了一定程度的缓解。但是由于目前大部分通用搜索引擎所采用的关键字匹配的检索模式,以及自然语言当中存在的一词多义的现象,造成了搜索结果中包含许多与用户需求无关的信息,降低了用户的检索效率。本文希望通过获取用户提交某关键字时的查询目的来对搜索结果进行优化,从而更好的满足用户的需求。我们使用网页分类技术对包含某词语的网页进行分类分析,发现了词语具有类别属性,即大部分词语通常只在某一个或若干个类别当中有意义,可以利用这一特点来表示用户的查询目的。并且,可以根据词语的类别属性的特点而将其分为“单义词”和“多义词”,相应地将用户查询目的提取分为“常规查询目的提取”和“个性化查询目的提取”。面向单义查询词的查询目的提取被称为“常规查询目的提取”。因为单义词只在一个类别当中有意义,所以可以认为不同用户提交单义词时的查询目的都是一样的,因此提取常规查询目的即是提取该词语的类别属性。我们用基于潜在语义分析的方法获取词语类别属性,并通过实验证明了它的有效性。面向多义查询词的查询目的提取被称为“个性化查询目的提取”。多义词在多个类别当中都有意义,所以不同的用户提交相同的多义词时其查询目的很可能是不同的,需要根据此用户的个人兴趣来做进一步的判断。我们通过对用户浏览过的网页集合进行分析来研究用户兴趣,并列出了对一个用户的兴趣进行分析的结果,在最后根据这些分析说明了提取用户的个性化查询目的的方法。
其他文献
P2P技术的迅速发展,使其成为构建广域网中大型分布式系统的强有力工具。P2P采用完全分布式结构,网络中的节点既充当客户端角色获取其他节点的资源或服务,同时又充当服务器角色向
随着互联网技术与应用的迅速发展,Web服务作为一种新兴的Web应用模式及远程访问标准,很好地解决了异构平台上的数据和应用的整合与共享问题。但是,传统的Web服务缺乏语义信息
随着万维网的不断发展,用户从海量数据中提取有效信息变得越来越困难。聚类分析作为web数据挖掘的重要方法,对降低数据规模,过滤无效信息起着至关重要的重用。本文以基于web日志
随着软件在安全关键领域的广泛应用,可信软件的研究成为可信计算研究中的一个重要内容。由于软件系统本身的复杂特性,如何使软件具有可信性的研究面临着巨大挑战。它要求人们对
本文的研究来源于河南省自然科学基金项目(NO.0611053900)“区间逻辑的柔性化理论研究”和河南省重点科技攻关项目(NO.092102210149)“基于区间结构的柔性化控制模型及其系统
无线传感器网络在军民用领域有着广阔的应用前景,是目前学术界研究的热点之一。它综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作完成实时监测
近年来,随着传感器技术、无线网络通信技术等日新月异的飞速发展,多功能化的智能设备充斥在人们的社会生活、学习工作中,以智能手机、平板电脑等为首的移动设备充当了移动计
通用的搜索引擎接到不同用户输入查询词后,按照统一模式处理,搜索引擎返回一样、成百上千、与用户兴趣不相关、重复甚至是过时的信息。个性化技术针对不同的用户采取不同的服务
近年来,随着高等教育事业的推动,高等院校的信息化发展来到了一个前所未有的时代,但是随着高校图书资源的规模的不断扩大,图书管理人员需要花费大量的人力、物力、财力及时整理图
现有的事件机制多采用传统客户机朋艮务器结构,两层结构虽然给人们带来了相当的灵活性,但也逐渐暴露出其客户端和服务器端负担过重的现象,并且其系统拓展性也较差。随着网络