论文部分内容阅读
科技文档和科研工作者是科学研究中最根本的资源,在第一时间准确地得到相关的科技文档,从科学社区中获得持续的帮助对于科学研究是非常重要的。然而,信息技术和网络技术的飞速发展,在给人类交流和信息传播带来了革命性变化,为人们的生活、工作和科研带来了巨大方便的同时,也导致了“信息过载”和“信息迷向”。Web中可用科研文档的迅速增长使得科研工作者要想及时、准确地从Internet上获得相关文档变得越来越困难。与此同时,同一科研组织中的不同科研人员由于其研究领域通常存在交叉,他们常常为了获得相同文档而重复搜索和下载,这不但直接增加了成员负担、造成组织资源的浪费,还间接导致了组织工作的效率低下。有效的文档共享方法能够提高科研团队的工作效率和竞争力。很多情况下,我们发现有些问题只有在相关人员一对一的帮助下才能得到较好的解决。在组织成员遇到自己无法解决的问题时,从组织中寻找合适的人来帮助他,是一个较好的选择,成员之间的相互帮助构成了组织内部隐性知识的共享。隐性知识的共享能够辅助科研人员更好地从事科研工作。个性化服务是一个自动获取用户对信息资源或借助信息形态表征的实物资源的使用信息,分析这些信息得到用户的特定兴趣和需求,然后根据分析结果在合适的时间向每一位访问者发送正确信息的过程,具有针对性、自动性特点。本文以信息流为基础,通过个性化的文档推送和协助者推荐实现知识网格环境下的资源共享。主要工作和成果如下:准确地描述用户模型是有效的文档共享的前提,目前用户信息不足是个性化服务中普遍存在的问题。我们以由各种消息构成的信息流为基础建立用户模型,信息流相对于用户注册,用户评价,相关反馈等是建立用户模型更为稳定和丰富的数据来源,使用户兴趣的描述更准确。提出了以社区结构和信息流为基础建立general-to-specific的用户模型的方法,即,根据组织的社区结构建立描述社区共同兴趣的社区模型并通过信息流的内容挖掘建立反映社区成员区别的个人模型。通过社区结构的发现找到具有共同兴趣的组织成员,而不是传统地根据用户所填写的注册信息来发现有共同兴趣的用户。对用户兴趣漂移问题进行了分析,通过时间因子调整信息流对用户模型的影响,使用户模型自适应用户兴趣的改变。提出了基于信息流的社区发现方法。基本思想是利用组织内各种消息构成的信息流网,以基于edge betweenness centrality思想的社区发现办法找出自组织社会网中的社区结构。根据信息流网络的特点扩展了基于edge betweenness centrality的社区发现方法,并将该方法应用于加权的社会网络找出组织内由拥有相似兴趣的成员自发构成的共同兴趣社区。