论文部分内容阅读
对于科技文献的浏览和检索,传统的基于关键字的文献检索和浏览方式难以对大量信息进行整体的多角度揭示,同时,关注的文献信息形式单一,忽视了文献之外的信息及关系,使得浏览和检索的效率不高。因此,研究高效优化的浏览机制,帮助研究人员快速有效的查找文献信息,成为一项重要而急待解决的课题。针对上述问题,基于语义的文献关联信息浏览系统SLAIB(Semantic based Literature Association Information Browsing System),提出一种科技文献语义关联模型,并基于该模型,采用关联信息可视化策略、关联信息双缓存机制以及相关算法,在基于语义的科技文献检索平台SemreX(Semantic based Literature Retrieval and Sharing Platform)中实现了实时交互的文献关联信息浏览。科技文献语义关联模型描述了科技文献中的实体、实体之间的各种关联以及实体的属性和关联的属性;关联信息可视化策略采用二维网状可视化方式,交互地展现作者之间的关联,将科技文献语义关联模型中重要的关联信息以不同的可视化隐喻方式显示,并且支持关联信息交互式的查询和动态浏览;关联信息双缓存机制将科技文献语义关联模型中重要的关联信息融合成一个整体,以链式结构并采用递归方法缓存在服务器和客户端,以保证可视化的实时交互性。另外,通过作者推荐算法,遵循“两作者创作的所有文献之间的相关度的平均值越大,则两作者越相关”这一思想,计算科技文献语义关联模型中作者之间的相关度,以便在可视化视图中展现作者之间的关联程度,引导用户浏览感兴趣的作者信息。采用Java语言实现了系统SLAIB,并对系统进行了测试分析。功能测试主要对关联信息可视化进行测试,并同著名的文献检索系统CiteSeer和DBLP进行对比,测试表明:SLAIB功能完备、关联信息丰富且交互性强。性能测试主要对关联信息双缓存机制的整体性能、可扩展性进行了测试和分析,测试表明:采用关联信息双缓存机制为单用户请求多个关联信息单元、多用户同时访问服务器提供了有效支持(单用户请求的关联信息单元个数多达50时,响应时间降低98.46%;同时访问服务器的用户个数多达110时,响应时间降低99.71%)。