论文部分内容阅读
近几十年来,网络技术的飞速发展,使得网络成为我们生活中不可缺少的部分。网络中的海量资源随着网络规模的膨胀为传统网络应用带来了新的挑战。在一个网络环境中,CPU、存储能力、带宽、缓存,文件、服务等都统称为网络环境中的资源。网络资源的组织、寻获、管理、推荐、使用成为了信息检索新的研究内容。传统网络计算模型因为其潜在的缺陷(集中组织、集中控制等)使得一种新的网络计算模型的出现成为必然。P2P网络克服了传统网络模型的瓶颈,因为其:自组织性,对称性和其adhoc特性成为了在网络技术中的主流趋势。也正因为上述三个特征,使得P2P环境中的资源组织、寻获、管理和使用无法用传统技术来实现,如何利用P2P网络的优势,实现上述目标,是广大学者重点关注的内容。正如前面所述,大部分的P2P研究者主要的工作都集中在资源组织、发现和应用上,这使得相关算法的研究成为前沿。支持P2P网络资源组织和发现的覆盖网络应该是“结构化的”或“非结构化的”?这两种方法是相互竞争的或是相互补充的?就这一问题,本文进行了深入分析。结构化的方法虽然能够快速定位资源,但网络本身的拓扑结构,如超立方体,环,蝴蝶型或其他各种拓扑结构在路由问题上起着巨大的阻碍作用。而非结构化的方法虽然不存在这样的问题,但是它采用的泛洪或随机路由或流言路由方法,都使得发现成功率必须依靠大量的带宽耗费(大量消息耗费)作为代价。因此在P2P网络中提出一种新的不依赖于网络拓扑结构,又能够在一定消息耗费前提下保证发现成功率的资源组织方法、发现和路由策略是必然的结果。本文提出了一个构建于完全分布式P2P网络的中间件TRM。TRM满足P2P网络的分散性、高度动态性、可扩展性、容错性等特点实现了复杂语义请求的资源搜索(近义词、同义词搜索)。通过TRM构建基于本体的P2P覆盖网络DOverlay,实现了有效的资源的自组织和动态聚类,它保证了请求的搜索半径。DOverlay中资源标记既不采用DHT,也不采用关键字向量,而是采用基于本体概念的属性向量标记。并提出了针对DOverlay的基于复杂语义的资源搜索策略(TRM_Search),据此对发现的资源进行有效的聚融(TRM_Evaluate)。TRM_Search策略不仅可以支持由复杂语义(同义词、近义词)所构成的请求处理,还通过试验证明其搜索的高效性和低成本性(消息数控制良好)。而TRM Evaluate策略则在资源发现后对多个资源进行综合评级。另外,在已有P2P环境的资源推荐中,由于推荐策略过于死板,没有充分考虑用户特征和推理不准确导致了已有方法无法满足P2P网络中的adhoc特性,进而无法实现高动态性的个性化资源推荐。在通过对上下文觉察计算的特点、用户行为和用户的个性化需求的研究后,我们发现,用户认知方式的特点在上下文觉察计算领域是具有研究和应用价值的。在上下文觉察计算中使用包含某些认知方式的用户模型可以提供更有针对性的个性化服务。因此,我们提出一个基于场依存/独立性(Field Dependence/Independence,简称FD/I)这一认知方式的用户模型并把它应用在上下文觉察计算中。我们的研究表明这个用户模型有助于提供给用户更个性化的内容。在资源推荐推理上,采用在信息检索(Information retrieval,IR)中所经常采用的计算本体相似度的思路,将其修改后应用到基于本体的上下文的相似性计算。我们的方法计算用户当前上下文和已有资源的发生前提(也是一些上下文)之间的相似度,找出最相似的服务上下文,推荐对应的资源。我们的方法利用了基于本体的上下文和CBR的优点,能够提供更好的推理效果,从而实现更准确,更符合P2P网络特性的特性化资源推荐。本文的研究工作和创新点主要包括以下几个方面:(1)提出了一个构建于完全分布式P2P网络的中间件TRM。TRM满足P2P网络的分散性、高度动态性、可扩展性、容错性等特点实现了复杂语义请求的资源搜索(近义词、同义词搜索)。(2)TRM中的覆盖网络DOverlay即不采用DHT,也不采用关键字向量,而是采用基于本体概念的属性向量标记。(3)提出了针对DOverlay的基于复杂语义的资源搜索策略(TRM_Search),并提出了对发现的资源进行有效的聚融的TRM_Evaluate策略。(4)提出一个基于场依存/独立性(Field Dependence/Independence,简称FD/I)这一认知方式的用户模型。(5)提出了一个基于语义相似度的个性化资源推荐策略,可增强推荐环境中的语义互理解性,从而实现复杂语义环境下的资源推荐。