论文部分内容阅读
随着互联网的普及和加快发展,人们已不再满足于只能在Internet网络上面进行一些简单查询的现状。人们迫切需要能够从互联网获取更加全面、准确、及时的信息。但由于现有的互联网在及时性、有效性、完整性方面的局限性,尚不能够满足人们的需要。人们因而又提出了一种新的网络模型——语义网络(Semantic Web),来取代现有的网络以满足用户日益增长的需求。研究人员已经提出了一系列的方案来实现和普及语义网络。本文讨论了语义网络实现过程中的一个热点问题,即如何在语义网络中实现个性化的信息服务。语义网鶭络并非一个独立网鶭络,而是当前的万鶭维网的延鶭伸,其目鶭标是让计算鶭机能够“理鶭解和处理”数鶭据,并为人鶭们提供各种智鶭能服务。当前,对语鶭义网络的概念还没有形鶭成统一的定鶭义,对语义网鶭络的理解表鶭达也各不相鶭同。最普遍的一种说法是“语义网络是第三代网络,其目标是实现机器自动处理信息。”通过信息处理的智能化,人们就能够获得更加精确的信息来满足需要。在众多语义网的应用中,如何实现语义信息在文件检索中的应用,特别是提供个人化的服务。一个关键问题就是用户建模,即如何表示用户的兴趣所在。在分析了现有的用户建模的方法的优缺点后,论文提出了一种基于领域本体(domain ontology)的用户模型——用户本体模型(user-onto model),来实现该目标。与只使用关键字(或主题词)的现有方法相比,新提出的用户本体模型的方法可以高效率地运用领域本体中直接的概念和关系来表征用户兴趣,从而能够获得更准确的用户模型。进一步,论文设计了一系列的统计方法来实现提出的用户本体模型以及引入了一个基于激活传播理论的推演算法来在用户本体里面进行推演。同时,设计了一个基于语义网络的搜索引擎来进行文章查询并且把设计好的的用户本体模型引入该引擎来实现个性化服务。通过在Google Directory数据集上面的实验,证明了本文中提出的用户本体模型能够有效地在语义网络中提供个人化的信息服务。