论文部分内容阅读
网络信息资源的组织、获取和推荐,一直是信息管理领域所关注的主题。随着网络信息资源的迅速增长,特别是信息用户的个性化、社会性需求质量的提高,用户能否获得自己需要的信息,以及信息服务商能否向合适的用户推荐合适的信息,已经变得越来越重要。
Web2.0环境下,信息用户能够主动地和交互地参与信息资源的创建和获取,尤其是社会化标注技术的出现,使得用户与信息资源之间的关联更加紧密。用户、信息资源和标签构成社会化标注系统的三要素。其中,标签是联结信息资源和信息用户的中介,信息用户根据自己对信息资源的认知和偏好,选择自己认为合适的标签词语,对相应的网络信息进行标注。大量的信息用户对大量的信息资源标注的结果,就形成了社会化标注。
用户通过社会化标注系统获得合适信息的前提,是能够准确识别信息资源的属性特征以及用户的偏好特征,但在社会化标注过程中会存在同义、歧义等混乱性问题,要克服特征识别过程中的混乱性干扰,就需要通过社会化标注系统要素之间的关联性研究,确定其关联性要素的分类、排序以及语义识别。
社会化标注充分体现了Web2.0环境的主动性和互动性的特征,并由此形成了具有关联性的信息用户、信息资源和标签三元素所构成的复杂网络。本文在对具有社会化标注功能的典型网站“Del.icio.us”相关数据进行分析的基础上,主要开展了以下三方面的研究:
(1)运用复杂网络理论中的社区划分模型,对社会化标注系统的相关要素进行了依据其关联性的社区划分,划分的结果将有助于信息用户在信息获取时进行类比共享。
(2)基于复杂网络理论中的二部分图模型,提出了包括信息用户、信息资源和标签类元素的三部分图模型,并以此对社会化标注系统的相关要素进行了排序,排序的结果将有助于信息用户在信息获取时进行对比评价。
(3)基于处理非线性识别问题的人工神经网络的相关模型,本文探讨了社会化标签系统要素的语义识别。分别运用BP神经网络所训练的权重来确定语义向量;运用SOM神经网络针对大众化的标签进行了语义聚类,进而确定了语义空间的维度;维度和向量确定后,再运用自组织竞争神经网络在特定的语义空间中对特定的要素进行语义性分类。语义识别的结果将有助于对要素特征的学习和识别。
依据上述研究所得出的关联性社区、关联性排序以及关联性语义识别,将有助于把握信息用户的需求偏好、信息资源的属性特征、以及社会化标签的语义特征,进而有助于信息用户对信息资源的主动获取,以及信息服务提供商的个性化推荐。