基于系统设计的微博检索系统评价研究

来源 :图书情报工作网刊 | 被引量 : 0次 | 上传用户:liongliong499
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要] 在以往检索系统评价指标的基础上,提出适合于评价检索系统的指标集,具体为检索界面、检索框、分类检索、热门列表、检索选项、检索提示、页面描述和快照功能8项指标。在这一指标集的基础上,利用网络调查法和比较法对新浪微博搜索和百度搜索进行比较研究。研究结果显示,新浪微博搜索的检索系统虽使用大部分指标,但与百度搜索相比存在程度不深、力度不足等问题。最后提出新浪微博搜索可从优化分类检索功能、实现智能化检索、注重微博信息保存三方面着手改善,以提供个性化微博信息检索服务。
  [关键词] 新浪微博搜索 百度搜索 系统设计 检索系统 信息检索
  1 引 言
  随着计算机技术和网络技术的兴起与发展,网络已经成为重要的信息源。网络信息的内容极为丰富,传播速度也达到了空前水平,人们在日常生活学习中越来越依赖互联网来检索和获取各种信息。微博作为信息分享、传播以及获取的平台,小到生活琐事、娱乐八卦,大到政务公开、企业竞争,其影响已蔓延至社会各个领域。微博的迅速、直接、广泛的信息传递方式,一定程度上改变了人们获取信息的方式[1]。此外,随着新浪微博独立搜索页面悄然上线,微搜索时代即将来临,微博海量内容背后的搜索价值正在一步步被挖掘。微博在改变生活的同时,微博搜索也在逐渐改变着人们的搜索习惯。
  然而,用户在检索信息时,经常感到困难或对检索结果不满意,这种现象受到各方面因素的影响。王淑群[2]指出,影响网络信息检索的因素是多种多样的,有网络信息提供者方面的因素、信息资源本身的因素、检索工具的缺陷以及用户的主观因素。然而,以上4个方面因素的改善都需要清晰易用的系统设计的支持,即检索系统设计对信息检索效率有着至关重要的作用。微博虽已成为人们获取信息的重要渠道[3],但微博信息自由发布,信息来源分散、无序以及微博信息不断变化、更迭、新生、消亡等特征,使得用户想利用微博准确、快速、全面地获取所需信息变得困难,重视系统设计成为提升其检索效率的重要渠道。
  为了使用户更好地利用新浪微博检索所需信息,提升新浪微博搜索的易用性及用户满意度,笔者对新浪微博搜索的检索系统设计进行评价研究,并将其与较成熟的搜索引擎——百度搜索进行比较分析,为新浪微博搜索的进一步改进提供意见,以更好地满足微博用户的信息检索需要,提供更大范围的信息服务。
  2 研究对象及方法
  优秀的检索系统是从用户角度出发[4],通过多种方式整合尽可能多的资源,并提供简洁的检索界面,为用户隐藏复杂的检索细节,提供丰富易用的检索功能,以节省检索时间、优化检索结果。本文以新浪微博搜索和百度搜索作为研究对象,通过观察分析与比较分析,对研究对象的系统设计与布局进行深入观察。新浪微博搜索以微博作为信息平台,为用户提供了获取信息的新渠道。对新浪微博搜索进行评价分析,指出其优势与不足,可为更好地提供信息检索服务提供依据。选择百度搜索作为新浪微博搜索的比较对象,是因为百度搜索作为全球最大的中文搜索引擎,其检索系统较成功地为用户提供检索服务,与其进行比较能更好地分析出新浪微博搜索存在的问题并为其改进提供借鉴。
  目前,在检索系统设计方面并没有形成系统的评价指标体系。2010年,Salim Alkindi和Abdelmajid Bouazza[5]对检索系统评价指标进行分析总结,得出A-Z列表或导航栏选项、检索选项或检索框、按不同内容检索、页面描述、检索链接、热门列表、检索结果页、使用搜索引擎8项指标。2005年,Burke[6]提出检索选项及检索框在检索系统中的重要作用。2006年,Morville和Rosenfeld[7]提出检索系统应提供用户按照不同的内容进行检索,即分类检索功能。Nielsen[8]在2000年提出页面描述、检索连接、热门列表和检索结果页在检索系统中的重要作用。综合以上学者的研究成果,从中抽取部分评价指标,结合笔者检索体验和知识储备提出适合于新浪微博搜索和百度搜索的检索系统评价指标集,具体评价指标如表1所示。
  3 分析与结果
  3.1 检索界面
  检索界面是用户对检索系统的第一印象,是检索系统的门面。设计良好的检索界面是检索系统的第一要务,它能为用户提供良好舒适的检索体验。从满足基本功能到增加用户黏性,检索界面至关重要。保持页面的一致性是检索界面设计的首要标准,拥有较高一致性的页面既能强化检索风格,又能在检索体验上给用户带来方便。其次,简洁易用的检索界面是方便用户,尤其是缺乏检索技巧的用户的重要因素。它可以最大程度地缩短检索准备时间,在一定程度上提高查全率和查准率。最后,在不变中寻求变化是保持用户新鲜感的重要因素。检索界面过于一致和缺少变化会使用户感到厌烦和疲劳,进而很容易失去兴趣。因此在保持一致和简洁的检索界面的同时,还要注意同中有变,满足用户追求变化的心理[9]。
  根据以上标准对新浪微博搜索和百度搜索的检索界面进行观察分析(见图1、图2),得出以下结论:①新浪微博搜索和百度搜索均有较好的界面一致性,页面结构清晰,层次分明,内容完整,在主页设计上具有一定程度的相似性。②新浪微博搜索和百度搜索页面简洁清晰,方便易用,用户可直接按所需内容进行检索。③百度搜索界面随着其旗下产品的丰富及技术的娴熟不断进行升级,且百度图标会根据节日或纪念日而有所改变,给用户带来新鲜的产品和视觉体验。而新浪微博搜索作为新浪新推出的独立搜索平台,其变化还需要在今后进行观察验证。由此可见,新浪微博搜索和百度搜索均提供了清晰易用的检索界面,为用户提供了良好舒适的检索平台。
  3.2 检索框
  检索框是进行信息检索的入口,是用户需求同检索系统连接的纽带。对于检索系统来说,检索框应处于明显的位置以方便用户使用。此外,不论在主页还是检索结果页,检索框都应放至用户方便使用的位置,使用户检索、浏览时不受界面环境的影响,在对检索结果不满意的情况下可直接重新检索。新浪微博搜索和百度搜索都做到了突出检索框,在任何界面都可以使用检索框重新检索。此外,新浪微博搜索还将检索框并入常用菜单永久置顶,让搜索更加方便,见图1、图2。   3.3 分类检索
  随着互联网技术和多媒体技术的发展,信息类型呈现多样化、多元化发展趋势。分类检索可以帮助用户直接获取所需类别信息,用户首先判断所需信息的类别,然后在搜索页面找到目标类别,最后搜索引擎返回符合条件的该类信息给用户。检索系统按相关标准提供分类体系,并且同时将这些分类体系在主检索界面上提供链接,用户可通过链接到达相应的类目体系进行检索。新浪微博搜索根据微博特征提供不同类型的检索结果选项,如微博、找人、图片、微群、活动、应用、投票。百度搜索涉及范围广,提供的检索分类涉及到方方面面,甚至可以同门户网站相媲美,其中包括新闻、网页、贴吧、知道、MP3、图片、视频、地图等,具体见图1、图2。此外,百度搜索每项检索分类均有自己独立的主页,而新浪微博搜索尚无此功能。
  3.4 热门列表
  随着网络信息的爆炸性增长,信息过载和信息时效问题对于信息检索来说日益突出,为了能充分把握最新有用的网络信息,提供热门信息列表以方便用户直接获取最新信息是十分必要的。对新浪微博搜索和百度搜索热门列表情况进行观察分析,得出以下结论:①新浪微博搜索和百度搜索主页上均设有热门搜索列表(见图1、图2),其中百度搜索需用户完成注册并登陆,才会在检索框下显示实时热点功能。②新浪微博搜索作为实时信息分享平台,更强调信息的时效性,除主页外,其检索结果页也随处可见“热门搜索”相关字样,方便用户更加直观地获取最新信息,见图3。③百度搜索在热门搜索方面表现突出,以百度新闻为例,其不仅包括热门搜索词,还利用导航栏对热门新闻进行分类,方便用户快速根据需要获取相关信息。此外,百度热搜词更新速度快,由机器每5分钟自动选取更新。
  3.5 检索选项
  多元化的检索选项可以帮助用户缩小检索范围,更加精确、快速地检索到所需信息,是缩小检索范围、提高检准率的必要方式。检索系统体现多元化检索的途径是通过高级检索限定检索项,以方便用户进行各种检索查询和限制。新浪微博搜索的高级检索功能为用户提供关键词检索,并对排序方式、类型、时间、地点进行限制,见图5。其限制条件符合微博自身特征,一定程度上起到了缩小检索范围的作用,但缺乏检索字段、检索词等方面的限制,仍有很大的提升空间。百度搜索的高级检索功能包括检索词的布尔逻辑检索、位置检索、字段检索,还可限定每页显示检索结果的条数、网页语言、文档格式、时间等,见图6。此外,百度为方便缺乏检索技巧的用户使用高级检索,将布尔逻辑检索用通俗的文字表达出来,使得各类型用户均可方便、快捷地使用其高级检索功能。
  3.6 检索提示
  用户如何利用网络检索工具查找所需信息,包括检索方法、检索策略以及对检索工具的选择等,都是影响网络信息检索效率至关重要的因素[10]。此外,由于有些用户对自己的检索需求没有明确的定位,因此检索词选择不当,检准率降低。对于缺乏检索技巧或检索需求不明确的用户,可进行探索式检索,在检索的过程中不断发现信息需求,此时检索系统提供的检索提示功能就显得尤为重要。首先,用户可以通过相关搜索来获得启发。新浪微博搜索和百度均有“相关搜索”功能,提供和用户检索词相似的一系列查询词,相关搜索均排布在搜索结果页的下方,按搜索热门度排序。其次,在检索框中输入检索词时,检索框下方会自动弹出与所输入检索词相关的词条帮助用户进行检索,以缩短输入时间,这可以看做“相关搜索”的另一种表现形式,见图7、图8。最后,由于汉字输入法及用户掌握知识的局限性,在搜索时经常输入一些错别字甚至拼音,导致搜索结果不佳。新浪微博搜索和百度均通过对中文用户搜索习惯的理解,给出错别字纠正提示,并显示在搜索结果上方,其中百度将检索词为拼音的检索自动返回相应汉字的检索结果,微博则没有做到这一点。
  3.7 页面描述
  页面描述是对整个检索结果的说明,如检索出的条目总数、与用户检索目的相关的检索词、网页链接、原文标题、原文摘要等。页面描述内容过于简单,用户则需要点击结果进一步判断内容的相关性,增加了检索负担及检索时间。对于新浪微博来说,由于其微博内容140字符的限制,搜索页面可以显示每条结果的全部内容,使用户对微博内容一目了然。百度页面描述涵盖内容较为全面,体现了丰富的网页属性,并用红色字体突出用户的检索词,进而帮助用户判断该条结果是否符合检索需求及是否需要阅读原文,见图9、图10。
  3.8 快照功能
  快照功能是指搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户使用时能够从服务器里直接取出缓存网页的功能[11]。在进行网上浏览时,如因网站服务器暂时中断或堵塞、网站链接更换、网页被删等原因不能正常链接到所需的页面,就可使用快照功能调用暂存的网页来救急,该功能基本上避免了死链或页面连接不上对搜索用户造成的不便,且其查找速度较常规链接快得多[12]。百度搜索提供网页快照功能,预先浏览各网站,拍下网页的快照并贮存起来,避免了连接失效等问题使检索结果丢失,见图10。新浪微博搜索并无此功能,虽其转发与收藏功能在一定程度上为信息保存提供了依据,但被删除微博仍无法长久保存。
  4 研究结果及建议
  优秀的检索系统能够使用户更方便地浏览网站,并快速准确地获取网站信息。新浪微博搜索作为一款基于新浪微博的垂直搜索,目前只对新浪微博的注册用户开放,搜索内容包括图片、应用、活动、微群、投票等,所有搜索内容均来自新浪微博[13]。微博搜索对于百度搜索来说,最大的区别和优势在于差异化。微博特殊传播方式以及内容的开放、海量,使得用户更加自由地获取信息,通过搜索可以获得一些搜索引擎难以获取的信息,更精确地满足网民的信息需求。按评价指标集对新浪微博搜索进行评价分析,并将其与百度搜索进行比较,最终得出结果见表2。
  从研究结果来看,新浪微博搜索虽使用了大部分检索系统特征,但层次不深、力度不足,同百度搜索相比仍有很大的差距。针对新浪微博特殊性及优秀搜索引擎的经验,可考虑通过以下方面着手改善。   ①注重分类检索功能,方便用户浏览、检索信息。首先,将各类信息进行分类和系统排列,使用户能够通过分类检索功能直观、方便地查找所需要的微博信息。其次,注重新浪微博分类检索的层次性和系统性,使其分类体系便于用户扩检和缩检。最后,新浪微博搜索可针对分类情况设计各类信息检索导航页面,实现按类别浏览检索。
  ②实现智能化检索过程,服务各类用户并节约检索时间。首先,当用户在检索框中输入关键词的前部分内容时,检索系统便对其可能的完整输入内容进行猜测,并显示在搜索栏下以便用户快速选择。其次,如果用户的输入存在错误,检索系统在允许范围内尝试纠错,并在检索框下方给出提示。目前,新浪微博搜索已经基本实现了以上功能,但在输入某些关键词进行检索时,并不能得到高度相关的检索提示,检索提示功能没有得到最大发挥,需在关联词库设计方面加以改进。
  ③强调保存功能,防止重要信息流失。新浪微博在微博保存上提供了“转发”、“收藏”等途径,但当原作者删除微博后原微博处会显示“该微博已被原作者删除”字样,转发者和收藏者也无法再浏览原微博信息,难以实现信息的长期保存。因此,新浪微博搜索应注重微博信息的长期保存,延长微博信息保存期限和使用寿命,进而为用户提供更丰富稳定的信息源。
  5 结 语
  研究构建的检索系统评价指标集是经过对用户检索行为的观察与筛选得出的,基本符合大多数用户的信息检索需求。但指标集仍有其不足之处:仅从检索系统功能和设计层面出发,几乎不涉及检索系统技术层面的特征;所有指标均为非量化指标,难以进行结构化分析;研究仅对评价指标逐条进行分析,没有划分权重进行细致比较。未来的研究中应加强以上几个方面的研究与分析。
  新浪微博检索系统的出现,是微检索时代发展的重要一步。尽管其本质是检索系统,但其基于微博的特殊性决定了它要为用户提供区别于普通检索系统的服务。因此微博检索系统在强调普遍性的同时,还应该突出其固有的特性,从而为用户提供更为全面准确的个性化检索服务。
  参考文献:
  [1] 新华网.商业价值主编张鹏:微博改变了信息传递方式[EB/OL].[2012-02-03]. http://news.xinhuanet.com/ewor-ld/2010-07/12/c_12323981.htm.
  [2] 王淑群.影响网络信息检索的因素与对策[J].图书馆论坛,2006(2):197-199.
  [3] 新浪科技.微博成为获取信息重要渠道[EB/OL].[2012-02-04].http://tech.sina.com.cn/i/2012-02-06/15246687778.shtml.
  [4] Toms E G, Taves A R. Measuring user perceptions of Web site reputation[J].Information Processing and Management,2004(2):291-317.
  [5] Alkindi S, Bouazza A. An evaluation study of the navigation and search systems on two academic websites and Google[J].The International Information & Library Review,2010(1):50-61.
  [6] Harpel-Burke P.Library homepage design at medium-sized universities: A comparison to commercial homepages via Nielsen and Tahir[J].Academic Research Library,2005,21(3):193–208.
  [7] Morville P, Rosenfeld L. Information architecture for the World Wide Web[M]. California O''Reilly Media,2006.
  [8] Nielsen J. Designing web usability:the Practice of simplicity[M].Indianapolis: New Riders,2000.
  [9] 乔冬梅.搜索引擎文本检索界面设计分析[J].图书情报知识,2003(6):48-50.
  [10] 余术淳.影响网络信息检索效率的因素[J].现代情报,2003(9):203-204.
  [11] 百度百科.网页快照[EB/OL].[2012-02-15].http://baike.baidu.com/view/522994.htm.
  [12] 黄文忠.网络搜索引擎百度评析[J].现代情报,2005(5):135-136.
  [13] 网易新闻.新浪微博搜索产品曝光,个性化搜索时代逼近[EB/OL].[2012-02-17]. http://news.163.com/11/1024/15/7H52M59U00014AEE.html.
其他文献
摘要:[目的/意义]随着知识管理相关理论的发展,各相关工业部门特别是完成了信息化的工业部门也面临着越来越紧迫的知识化转型。在知识化转型过程中除知识管理的相关理论外,也需要提炼出知识管理相关工具体系。[方法/过程]主要研究知识管理相关工具在电力行业市场营销领域中的应用,从电力业务人员日常接触的数据中萃取影响缴费用户的特征因素,并形成与用户缴费欠费习惯相关的关键知识,为业务人员未来工作进行指导。首先,
期刊
摘要:[目的/意义]网络舆情受众的失范行为是舆情出现剧烈变化的重要因素。本文重点研究失范行为靶向引导技术框架的构建,为失范行为实施引导提供技术手段。[方法/过程]在网络舆情受众失范行为靶向引导分析的基础上,建立框架模型,并对框架模型的各个模块进行具体描述;梳理各模块功能实现所需要的核心技术和进一步研究的思路,并以微博舆情为例对框架进行了验证。[结果/结论]靶向引导是理论与应用相结合的方法,网络舆情
期刊
【摘要】  对1988-2012年国家自然科学基金管理科学部对知识产权管理领域的立项情况进行分析和研究,从立项数目、资助金额、资助类型、主题词、学科类别、项目负责人、申请高校和研究类型进行统计,从中发掘和探讨知识产权管理学科受资助的特点和发展趋势。  【关键词】  国家自然科学基金 知识产权管理 管理科学  引言  中国国家自然科学基金(NSFC)自1986年设立以来,为中国基础研究提供了最重要的
期刊
【摘要】  在构建图书馆可持续发展力的定性评价指标体系的基础上,针对定性指标难以准确量化和专家赋权主观性较大的问题,引入信息熵模糊综合评判法,建立高校图书馆可持续发展力的评价模型。最后,通过实例进一步说明该方法的可行性。  【关键词】  图书馆 可持续发展力 信息熵 模糊综合评判  引言  随着信息技术和网络技术的飞速发展以及可持续发展理论的提出,图书馆可持续发展能力的评价研究备受关注,通过评价可
期刊
>>【摘要】  关联数据的出现使得语义网发展取得了实质上的突破,被W3C推荐为语义网的“最佳实践”,得到各个领域的关注。关联数据为农业知识管理提供了新的解决方案,农业知识管理领域也是关联数据的最佳应用平台。在FAO良好的本体、信息管理系统和标准工作的基础上,基于关联数据的农业知识管理已经取得了很大的进展。介绍基于关联数据的农业知识管理研究与应用,并对此进行总结、分析与展望。  >>【关键词】  关
期刊
[摘要] 比对事实与统计数据,发现纸质期刊向电子期刊转变过程中,出版机构日益集中而图书馆书刊选购任务更为重要。随着电子期刊发展而出现的开放获取期刊,早先被认为能够解决传统商业期刊的价格昂贵问题,然而图书馆经费紧张的局面始终未变。  [关键词]开放存取 电子期刊 出版集中 捆绑交易 价格危机  1 前 言  从上世纪70年代中期开始,美国大学图书馆的学术期刊馆藏量难以跟上世界学术期刊总量的
期刊
[摘要] 简述联合国文件涉及的议题、特点、出版量和传播途径,然后结合国图参考咨询馆员在一线工作中所获得的典型咨询案例,重点介绍研究中利用文件的方法与技巧,最后对网络环境下图书馆如何加强联合国文件及相关知识和信息的收集与传播提出建议。  [关键词] 联合国文件 研究工具 检索途径 开发利用  1 引 言  联合国是处理全球重大问题的政府间国际组织,为审议各种议题,联合国每天大会小会不断,年会
期刊
【摘要】  在中文社会科学引文索引(CSSCI)中检索并下载《图书情报工作》1998-2010年共13年的题录及引文数据,分别绘制其作者、机构、期刊、关键词和引文的知识图谱,通过对图谱进行深入的分析与解读,全景化揭示该刊的知识结构和知识特征。  【关键词】  科学知识图谱 《图书情报工作》 文献计量学  引言  创刊于20世纪50年代的《图书情报工作》,是由中国科学院主管、中国科学院国家科学图书馆
期刊
【摘要】  在分析知识工作者生产率评价和生产率测量维度重要性的基础上,通过文献回顾总结出知识工作者生产率测量的13个维度,作为问卷调查的题项,有针对性地对215名知识工作者进行调查。并对所得数据进行描述性统计分析、因子分析、信度与效度分析,最终确定知识工作者生产率测量的5个维度,分别是:工作数量、工作质量、工作有效性、客户满意度和工作成功度,详细分析这5个维度,为知识工作者的生产率评价指出方向。 
期刊
【摘要】  分析社交网络中的知识共享现象及其特征,将人本身也视作一种隐形知识,提出基于差序格局的知识共享模式,并分析该模式对促进知识共享的意义以及利用方式。  【关键词】  差序格局 社交网络 知识共享 人本信息资源  引言  随着Web2.0时代的到来和SNS(social network site )的深入发展,人们已经习惯在自己的虚拟社区中获取知识、搜寻知识、分享知识,并且希望将这种虚拟空间
期刊