论文部分内容阅读
【摘 要】在互联网技术发展下,网络信息量急剧增加,搜索引擎成为网络信息查询的重要手段,目前搜索引擎已不能有效满足应用者的需求,加强下一代搜索引擎的发展已成必然趋势,本文介绍了搜索引擎的分类与功能,分析了当前搜索引擎存在的问题,探讨了下一代搜索引擎的发展趋势。
【关键词】下一代 搜索引擎 发展趋势
随着网络科技不断发展,社会信息量越来越多,网络为人们带来丰富的信息资源同时,也让有效信息的获取成为难点,为了有效满足网络应用者的信息搜索需求,搜索引擎的作用越来越重要,已成为人们网络应用中的重要手段,并呈现出快速发展的趋势。
一、搜索引擎分类与功能
(一)搜索引擎分类
搜索引擎所指的是依据一定策略,利用特定计算机程序,在互联网上进行信息搜集,向用户提供相关的检索服务,对信息给予组织与处理之后,将检索信息展现给用户的系统。根据工作原理不同,搜索引擎可分成全文搜索、目录索引类搜索与元搜索引擎等,其中,目录索引类的搜索引擎主要是通过人工方式,对网站资料数据库进行收集整理,严格来说,这并不是真正搜索引擎,只是按照目录进行分类的链接列表,其代表有国内新浪、搜狐与雅虎等分类目录;全文搜索引擎为真正搜索引擎,典型代表有百度与Google,其数据库是通过Robot或者Spider软件,对Web空间进行遍历,扫描一定IP地址范围中的网站,通过网络链接获得大量的网页内容,以获取最新资料信息;而元搜索引擎则是指无自身数据库与Robot,其搜索结果是通过控制、调用及优化各独立搜索引擎进行结果搜索的,并按照统一格式进行同一界面的集中显示,其代表有Dogpile、搜星搜索与Info Space等引擎。
(二)搜索引擎的功能
目前搜索引擎的功能主要为信息搜集、整理与接受查询等。在搜索引擎中,信息搜集功能通常是自动的,搜索引擎运用网络蜘蛛中的自动Robot程序进行每个网页的超链接,从理论上看,网页上一旦有恰当的超链接,Robot就能遍历大部分的网页。搜索引擎中的整理信息过程可称为创建索引,该功能不仅能保存所搜集的信息,还能按照一定规则给予编排,从而方便查询。而接受查询功能则是用户给搜索引擎发出有关查询请求,搜索引擎会接受查询,并给用户返回相关的资料,一般搜索引擎会给这些链接提供一段网页摘要信息,辅助用户判断网页内容是否所需求的信息。
二、当前搜索引擎存在的问题
(一)信息查询率低,更新速度慢
随着网络信息发展,海量信息的增加与人们获取信息的能力间存在的矛盾越来越突出,有关搜索引擎的问题也越发突出。网络信息质量层次不齐,Robot程序对信息进行搜索时,深度Web文档的挖掘有限,覆盖面有限。根据相关统计,无一个搜索引擎索引量能超越全部网络网页1/6的总数,不仅搜索精准度较低,还有大量重复连接与死链接。有些网页虽然无检索词出现,不过内容与检索词具有很大的相关性,搜索引擎却不能有效搜索这些网页,其信息搜索的全面性与准确性有待提高。因Robot仅能由管理员进行确定,并在一定时间间隔中,对特定信息进行跟踪,但无法确保信息能及时更新,致使出现死链与错链,由于网络信息指数的不断增长,使得引擎数据库越来越膨胀,其检索速度变慢,信息滞后。
(二)搜索结果单一,专业搜索引擎少
任何人应用同个引擎进行同一关键词搜索,其搜索结果是相同的,搜索引擎不会考虑用户兴趣特征、知识背景、性别与年龄等,未充分运用用户查询行为的记录日志,无单个用户浏览行为与浏览模式的功能分析,更没考虑不同用户对信息需求方面的差异性。当前搜索引擎多为综合的,对各方面、行业及学科间的信息收录较全面,但在专业信息与专题信息方面较少,难以做到快精准。如科研人员的网络需求,主要表现在专业信息的搜索上,可当前搜索引擎所收录信息的类型很多,有关专业性的搜索引擎比较少。
三、下一代搜索引擎的发展趋势
(一)加强信息检索准确率的提高
利用搜索引擎查询有关信息时,用户并不关心返回结果有多少,更为关注查询结果与自身需求是否相吻合,传统搜索引擎经常能返回几十万,甚至上百万篇的文档,而用户还需要在结果中进行筛选,为了改变这种状况,应该应用智能化代理对用户检索行为进行跟踪,对用户模型进行分析,并应用相关度进行机制反馈,让用户告知搜索引擎,哪类文档与自身需求有关,而哪些是不相关的,经多次交互进行信息的准确查询。
(二)下一代搜索引擎的智能化及多媒体化发展
网络用户对于信息检索方面,不仅要求精准率与效率提高,还要重视搜索引擎本身的检索服务智能化。让搜索引擎更为智能化,可利用自然语言及用户交互,有效了解用户需求,向用户提供智能化的推送服务与信息过滤服务,让用户告知搜索引擎自身信息需求,对于如何实现的,就不需要人工干预了,让用户从繁琐规则当中有效解脱出来。下一代搜索引擎在技术方面,将更为成熟,搜索内容向多媒体化进行发展,其图像、声音与动画等信息检索数据量不断增长,加强搜索引擎的多媒体化发展已迫在眉睫,能让用户更方便、直接与快速地获得资源信息。由功能来看,多媒体化的搜索引擎已不只是检索工具,已在向其他的服务领域扩展,可提供天气预报、站点评论与新闻报道等,以满足各类用户的需求。
(三)数据库专业化与服务个性化方向的发展
当前搜索引擎均是在力争把自己搜索范围扩展至整个互联网上,但因数据库的规模大,要提高查询速度,通常要牺牲资源信息质量,但网络用户所关注的是检索资源的准确率,并非查全率,为了提高搜索引擎的检索准确率,应该积极引导搜索引擎技术向检索结果准确率方面发展,构建专业化的数据库,满足用户特定信息的需求,让用户快速获取所需信息是下一代搜索引擎的发展方向。为了有效满足不同用户的信息需求,搜索引擎应加强服务的个性化与特色化发展,为用户提供全方位全过程的服务,让个性化搜索更加负荷用户需求,满足不用户,对不用领域资源信息的需求,搜索引擎的个性化也是下一代引擎的发展方向。
四、结语
随着网络科技的发展,人类信息资源的增多,网络用户要准确及时地获取所需信息,当前搜索引擎已不能有效满足用户需求了,需要改进搜索引擎搜索能力,细化搜索引擎市场,让搜索引擎向企业决策者、个性化服务者与知识型搜索者方向发展。
参考文献:
[1]张立娜,杨波.第三代搜索引擎发展现状研究[J].科技情报开发与经济,2011(34)
[2]许剑颖.搜索引擎发展趋势研究[J].现代情报,2011(9)
【关键词】下一代 搜索引擎 发展趋势
随着网络科技不断发展,社会信息量越来越多,网络为人们带来丰富的信息资源同时,也让有效信息的获取成为难点,为了有效满足网络应用者的信息搜索需求,搜索引擎的作用越来越重要,已成为人们网络应用中的重要手段,并呈现出快速发展的趋势。
一、搜索引擎分类与功能
(一)搜索引擎分类
搜索引擎所指的是依据一定策略,利用特定计算机程序,在互联网上进行信息搜集,向用户提供相关的检索服务,对信息给予组织与处理之后,将检索信息展现给用户的系统。根据工作原理不同,搜索引擎可分成全文搜索、目录索引类搜索与元搜索引擎等,其中,目录索引类的搜索引擎主要是通过人工方式,对网站资料数据库进行收集整理,严格来说,这并不是真正搜索引擎,只是按照目录进行分类的链接列表,其代表有国内新浪、搜狐与雅虎等分类目录;全文搜索引擎为真正搜索引擎,典型代表有百度与Google,其数据库是通过Robot或者Spider软件,对Web空间进行遍历,扫描一定IP地址范围中的网站,通过网络链接获得大量的网页内容,以获取最新资料信息;而元搜索引擎则是指无自身数据库与Robot,其搜索结果是通过控制、调用及优化各独立搜索引擎进行结果搜索的,并按照统一格式进行同一界面的集中显示,其代表有Dogpile、搜星搜索与Info Space等引擎。
(二)搜索引擎的功能
目前搜索引擎的功能主要为信息搜集、整理与接受查询等。在搜索引擎中,信息搜集功能通常是自动的,搜索引擎运用网络蜘蛛中的自动Robot程序进行每个网页的超链接,从理论上看,网页上一旦有恰当的超链接,Robot就能遍历大部分的网页。搜索引擎中的整理信息过程可称为创建索引,该功能不仅能保存所搜集的信息,还能按照一定规则给予编排,从而方便查询。而接受查询功能则是用户给搜索引擎发出有关查询请求,搜索引擎会接受查询,并给用户返回相关的资料,一般搜索引擎会给这些链接提供一段网页摘要信息,辅助用户判断网页内容是否所需求的信息。
二、当前搜索引擎存在的问题
(一)信息查询率低,更新速度慢
随着网络信息发展,海量信息的增加与人们获取信息的能力间存在的矛盾越来越突出,有关搜索引擎的问题也越发突出。网络信息质量层次不齐,Robot程序对信息进行搜索时,深度Web文档的挖掘有限,覆盖面有限。根据相关统计,无一个搜索引擎索引量能超越全部网络网页1/6的总数,不仅搜索精准度较低,还有大量重复连接与死链接。有些网页虽然无检索词出现,不过内容与检索词具有很大的相关性,搜索引擎却不能有效搜索这些网页,其信息搜索的全面性与准确性有待提高。因Robot仅能由管理员进行确定,并在一定时间间隔中,对特定信息进行跟踪,但无法确保信息能及时更新,致使出现死链与错链,由于网络信息指数的不断增长,使得引擎数据库越来越膨胀,其检索速度变慢,信息滞后。
(二)搜索结果单一,专业搜索引擎少
任何人应用同个引擎进行同一关键词搜索,其搜索结果是相同的,搜索引擎不会考虑用户兴趣特征、知识背景、性别与年龄等,未充分运用用户查询行为的记录日志,无单个用户浏览行为与浏览模式的功能分析,更没考虑不同用户对信息需求方面的差异性。当前搜索引擎多为综合的,对各方面、行业及学科间的信息收录较全面,但在专业信息与专题信息方面较少,难以做到快精准。如科研人员的网络需求,主要表现在专业信息的搜索上,可当前搜索引擎所收录信息的类型很多,有关专业性的搜索引擎比较少。
三、下一代搜索引擎的发展趋势
(一)加强信息检索准确率的提高
利用搜索引擎查询有关信息时,用户并不关心返回结果有多少,更为关注查询结果与自身需求是否相吻合,传统搜索引擎经常能返回几十万,甚至上百万篇的文档,而用户还需要在结果中进行筛选,为了改变这种状况,应该应用智能化代理对用户检索行为进行跟踪,对用户模型进行分析,并应用相关度进行机制反馈,让用户告知搜索引擎,哪类文档与自身需求有关,而哪些是不相关的,经多次交互进行信息的准确查询。
(二)下一代搜索引擎的智能化及多媒体化发展
网络用户对于信息检索方面,不仅要求精准率与效率提高,还要重视搜索引擎本身的检索服务智能化。让搜索引擎更为智能化,可利用自然语言及用户交互,有效了解用户需求,向用户提供智能化的推送服务与信息过滤服务,让用户告知搜索引擎自身信息需求,对于如何实现的,就不需要人工干预了,让用户从繁琐规则当中有效解脱出来。下一代搜索引擎在技术方面,将更为成熟,搜索内容向多媒体化进行发展,其图像、声音与动画等信息检索数据量不断增长,加强搜索引擎的多媒体化发展已迫在眉睫,能让用户更方便、直接与快速地获得资源信息。由功能来看,多媒体化的搜索引擎已不只是检索工具,已在向其他的服务领域扩展,可提供天气预报、站点评论与新闻报道等,以满足各类用户的需求。
(三)数据库专业化与服务个性化方向的发展
当前搜索引擎均是在力争把自己搜索范围扩展至整个互联网上,但因数据库的规模大,要提高查询速度,通常要牺牲资源信息质量,但网络用户所关注的是检索资源的准确率,并非查全率,为了提高搜索引擎的检索准确率,应该积极引导搜索引擎技术向检索结果准确率方面发展,构建专业化的数据库,满足用户特定信息的需求,让用户快速获取所需信息是下一代搜索引擎的发展方向。为了有效满足不同用户的信息需求,搜索引擎应加强服务的个性化与特色化发展,为用户提供全方位全过程的服务,让个性化搜索更加负荷用户需求,满足不用户,对不用领域资源信息的需求,搜索引擎的个性化也是下一代引擎的发展方向。
四、结语
随着网络科技的发展,人类信息资源的增多,网络用户要准确及时地获取所需信息,当前搜索引擎已不能有效满足用户需求了,需要改进搜索引擎搜索能力,细化搜索引擎市场,让搜索引擎向企业决策者、个性化服务者与知识型搜索者方向发展。
参考文献:
[1]张立娜,杨波.第三代搜索引擎发展现状研究[J].科技情报开发与经济,2011(34)
[2]许剑颖.搜索引擎发展趋势研究[J].现代情报,2011(9)