智能搜索引警与知识共享

来源 :中国信息导报 | 被引量 : 0次 | 上传用户:lihongde313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   作为第三代搜索引擎,将基于关键词层面检索的传统搜索引擎提高到基于知识(或概念)层面来分析、处理检提问,表现出较强的智能化与个性化特色。智能搜索引擎以一定的知识库技术为基础,具有很高的自然语言理解与知识处理能力,它应用于知识管理系统中,将会较大地推动数据挖掘、知识发现与知识流动,从而更准确、及时地促进知识共事的完成。
   一、智能搜索引擎的功能和技术
  1。功能特点
  智能搜索引擎作为基于语义网络等人工智能技术的新一代搜索引擎,具有用户角色登记、用户兴趣自动、内容语义理解、智能化过滤信息和主动化推送服务等功能,同时保持传统搜索引擎的,些优势如快速检索、相关度排序。智能搜索引擎突破传统搜索引擎基于关键词层面检索的局限,以良好的自然语言理解、知识逻辑推理能力,来判断、分析与处理用户的各种信息需求提问,即从知识(或概念)面域上同时匹配处理基于关键词的精确检索模式,以及基于自然语词的非规范表达句式,给用户提供检索问题的精确答案以及相关资料,使用户获得较高的检准率和检全率。因而智能搜索引擎的用户范围从具有良好信息检索素质的专业人士,扩展为无任何检索技能背景的普通用户。此外,它的人机接口和网络蜘蛛高度智能化,可跨平台工作、处理多种混合文档、支持多种语言搜索,并能根据用户的兴趣、爱好、特性、定题需求,不断实时推荐、推送相关的信息、知识,定制个性化页面等,表现出较大的智能性、主动性、交互性、人性化特征。2.检索机制
  智能搜索引擎实行检索时要构设知识库和用户档案库,知识库是对信息综合、提取、概括与分析后产生的知识集合,它提供智能搜索引擎理解、处理用户提问的资源标识,用户档案库则用来存储用户注册的基本资料、用户访问记录、用户兴趣偏好、用户访问行为等用户信息。智能搜索引擎内部共设有语义理解、访问登记、信息过滤等七大功能模块。在具体的检索过程中,语义理解模块依据知识库提供的资源标识,对用户提问进行分析、推理,然后由指令组织模块发出Hup请求的检索指令,同时对用户提问、定题需求等进行用户角色与信息行为登记,将用户的访问记录、兴趣爱好等信息传递给用户档案库保存起来。一旦产生新的信息资源,智能搜索引擎便由兴趣识别模块激活,抽取用户的信息需求,进而形成推荐推送服务的检索指令。在从网络信息库中搜索到相应的信息数据后,返回给智能搜索引擎进行过滤、排序、组织、加工,然后定制信息页面,将检索结果或推送信息提供给用户使用。如图1所示
  3.关键技术
  智能搜索引擎依赖许多先进的技术来实现它的各项功能,其中涉及自然语言理解方面的技术,包括将一种自然语言转换为另一种自然语言的机器翻译技术、语义网络技术、汉语切分技术、短语识别技术、同义词处理技术等;人机交互操作方面则有实行内码异码互换、模糊语义检索、自然语词查询等访问请求技术、访问向导技术、访问行为分析技术等;推荐推送服务方面,主要有智能搜索代理技术、网对网技术、概念搜索技术、PAQ查询技术、UⅡ兴趣识别技术及挖掘用户书签(或收藏夹)包含的潜在信息需求的书签驾驭技术等等。此外,智能搜索引擎还有u-nicode多语言支持技术、检索指令组织技术、文档压缩整合技术等一些重要技术。
  
  二、知识管理系统中的知识共享
  
  
   知识共享指组织机构在经营运行过程中所产生或获取的知识资源,通过一定的技术或相应的途径,并在知识流向的控制与监管之下,在职能部门之间、组织成员之间实行有效的流动与转移、优化的配置与调度、充分的开发与利用。知识共享包括两种知识资源的共享一种是显性知识,指那些能轻易被识别、获取、编码和流动的知识、信息,如文件、专著、手稿、手册、图片、图表、声像等,另一种是存贮在人的大脑中、难以获得和识别的隐性知识,包括经验、意会、判断、意识、诀窍等。
  知识管理作为一种通过对信息、数据处理的技术能力和人的发明创造能力有机结合以实行对知识资源控制与使用的管理模式,它强调打破组织机构的金字塔式等级知识结构,消除人为的知识分割与“知识孤岛”局面,加强各部门、人员之间的横向知识联系,实现组织内部拥有、利用知识方面的合理平衡。其实现途径便是知识共享。通过采取知识共享的手段,能够促使知识资源得到最大化的分配与利用,从而提高组织的整体知识水平和智慧能力,完成知识创新以增强组织生存与发展能力这一知识管理的核心目标。
  知识管理的核心在于加快知识的流动和使用,并创造价值。而知识流动和使用的实质就是知识共享。作为知识共享的主要表现形式,知识流动和使用一般包括三个环节1.知识获取,它以知识信息的搜索、浏览与接收这三种方式来完成数据的挖掘、信息的加工与知识的发现,2.知识编码,即指知识通过标准化、规范化的模式来表征、揭示,以便能轻易、快捷地流动与使用,3.知识转移,指知识在外部组织、内部组织与成员个人之间的相互转移、流动与传播,以保证知识的价值与能量得到充分的体现和发挥。
  
  
  三、智能搜索引擎
  
  
  在知识共享过程中的应用
  1.高度智能化的知识搜索技术智能搜索引擎充分利用先进的智能技术,通过自然语言与用户产生实时交互式的知识查询联系。它主要基于机器翻译和语义理解技术,通过实现各种自然语言之间的互换转变,设立知识检索词典,分析知识元的内涵及其各知识元之间的逻辑联系,揭示用户提问匹配对应于库内知识资源的内在关系等,完成对用户精确或非精确的检索用语在知识语义层次上的判断与推理。智能搜索引擎提供最切实、最有效的搜索模式,选择理想时机让网络蜘蛛等搜索器在知识库的网状知识体系里快速地遍历各知识元节点并自动、准确地搜集、提取相关的知识,然后经过智能化过滤、相关度排序等,实行系统性的知识元组织、加工与整合,定制出检索效果十分理想的知识页面。智能搜索引擎以良好的感应性,主动登记用户知识搜索行为,自动识别用户知识偏好,高效判断用户身份和访问权限,合理解释搜索知识库的最终结果,并不时调整自己的知识导航、捕捉、获取与搜索机制。
  2.多元个性化的知识推送服务应用逻辑多样性、个性化强是智能搜索引擎接入知识共享机制中的主要特点。具体来说,智能搜索引擎通过观察用户的行为,搜集用户利用信息、访问知识库的记录,掌握、熟悉用户对于知识的兴趣爱好,同时通过汉语分词、句法分析以及统计理论,有效地理解用户的个性化知识需求,并根据知识库的标引系统确定用户提问的检索概念、语义,以明白用户的真正意图和切实需求。智能搜索引擎的强大记忆和联想式功能,保证从用户档案库存放或提示的成员个人特征、部门机构特点、工作任务特性等用户资料信息中,析取、挖掘出用户的潜在知识需求,为其分门别类地设置知识推送频道或知识资源栏目,源源不断地从知识库中采集相应的知识、信息推荐给用户。此外,智能搜索引擎通过它良好的用户实时联系机制,以E—mail推荐、手机短信、在线传真等多种方式,突破时空限制即时即地、主动、迅速地为各种类型、语种、需求的知识用户提供跨平台、媒体等多样式的知识共享服务。
  
  四、基于智能搜索引擎的知识共享模型
  
  
  知识共享的主要前提是知识库的构建,从某种意义上说,知识库的丰富程度决定着知识检索效率的高低。因为智能搜索引擎需要从知识库中提取资源标识,而它在知识管理系统中面对的搜索对象直接是知识库,所以基于智能搜索引擎的知识共享机制便减少资源标识这一环节,从而具有较高的运作效率。这样,知识库便成为智能搜索引擎服务知识共享的关键所在。
  1.基于智能搜索引擎的显性知识共享模式
  显性知识库一般而言是通过组织机构的知识组织体系来完成构建。知识组织的本质是对知识元的充分表达和知识元相互之间的逻辑联系的有机揭示。显性知识包括组织内部产生、制造或创作出来的可视化信息、知识,例如业务表单、管理文件、产品数据、技术档案等所包含的知识内容,和组织从外部环境中获取、接收、购买或交换得来的信息资源,如市场行情、客户资料、政策法规、万维信息等。由于显性知识是能直接编码、组织、流动的物理物质意义上的信息,智能搜索引擎便能在网络平台上直接从显性知识库中,对用户的知识查询提问进行知识层面的分析、匹配处理,索引、调集命中用户知识需求的显性知识。另外,智能搜索引擎依赖相关的智能化功能,自动地根据用户档案库存贮的用户资料,感应、识别出用户的知识偏好以及需求倾向变化,实时地将显性知识库的新知识、信息推送给用户,或及时调整自身的信息推荐行为,来满足各成员、部门对显性知识资源的切实需求。基于智能搜索引擎的显性知识共享流程如图2所示。
  2.基于智能搜索引擎的隐性知识共享模式
  隐性知识与显性知识之间在共享使用方面最大的区别在于,前者不能轻易获取、编码,它是一个逻辑意义上的知识概念。通常而言,隐性知识的开发利用之前,须依赖建立组织激励机制、学习型组织结构等方法,实施人格化策略,促使隐性知识激发、表达与贡献出来,其具体形式有经验方法的面授、交流座谈会的召开、物质精神激励的运用、客户服务意见的反馈等,其中组织内部隐性知识包括成员个人的意会理念、发明诀窍、技能手段、经验技巧等,而来自外部环境的隐性知识形式则包括公众建议、客户意见、专家提议、咨询方案、管理评估等。隐性知识的显现化过程是知识自组织过程,即隐性知识由于人与人之间、人与知识要素之间的交互性、相关性、协同性或默契性形成特定知识系统结构和功能的过程,其实质是知识资源无须外界指令如人为的加工,而能自行组织、自我走向有序化。但是,这自行的知识组织与序化是逻辑层次意义上的,所以经过知识自组织过程产生或获取的隐性知识,不能直接置放于物理意义的网络平台中,供智能搜索引擎搜索。而应事先建立一套面向隐性知识类,如记录抄写性质的物理复制系统,形成存放对隐性知识初始化、粗加工处理的记录信息库,然后再根据知识管理和需要,对其进行判断、提取、分析和概括,实行深细性加工组织,构建成能从中进行物理搜索的隐性知识库。基于智能搜索引擎的隐性知识共享流程如图3所示。
  五、智能搜索引擎适用知识资源
  
   高效共享的技术改进
  
  
  目前的智能搜索引擎技术不太成熟,在服务于知识资源的共享过程中存在许多不足,伴随着计算机技术、网络检索技术等IT技术的快速发展和应用研究,可作如下几个方面的改进:
  1.提高对知识本体论层面的分析与判断能力。智能搜索引擎对知识的语言层面、常识层面的语义理解较为准确、全面,而对于本体论层面的判断则显得较为薄弱。因此需改善知识本体论层面的处理功能,提高对知识概念之间复杂的语义关系的分析能力。
  2.设立知识库状态动态监视和动态更新快速反应功能,进一步提高智能搜索引擎对知识库搜索的主动性与实时性,完善用户需求动态跟踪与知识即时推荐服务机制,不断适应组织知识树生长、知识点扩增的需要。
  3.有效利用元知识技术,强化智能搜索引擎的目标知识搜索功能。元知识作为关于知识的知识,是对领域知识的提炼和抽象,将其机理应用于智能搜索引擎,可较大地提高它对于知识库的搜索效率,特别是检准率方面。
  4.拓展范围更为宽泛、类型更为多样的知识检索方式,从布尔逻辑检索、全文检索、图像检索到跨知识库检 索、跨媒体检索,力争全面、完善地应用各种最新的信息检索技术成果,开辟智能搜索引擎的多种检索用途。
  5.充分运用神经网络、智能代理人系统等高级智能技术,促使智能搜索引擎具有更高层次的智能化与自动化功能,全面发挥推理机能对于知识概念与知识属性逻辑推理、判断的各种作用。
  6.加强智能搜索引擎对各种新型网络技术的适应能力方面的研究,尤其是大有取代万维网之势的网格技术,以提高智能搜索引擎在知识集成网络中的应用灵活性与机动性,继续保持它跨网络平台工作与处理各种异构数据的优势。
  
  六、结 语
  智能搜索引擎以较强的自然语言理解和知识处理能力,表现出良好的智能化、个性化功能优势,应用于知识管理系统的知识共享机制中,能为组织成员提供及时、准确、完善、高效的知识服务。智能搜索引擎以一定的知识库作为发挥作用的基础,虽然知识共享也是以构建知识库作为运行的前提,但其隐性知识库这一子库不是物理意义上的信息库,所以在进行知识共享之前,必须将此子库转化为能被智能搜索引擎实行物理意义搜索的知识库。然而,目前的智能搜索引擎技术并不太成熟,需要作较大的改进,才能高效、充分地应用于知识共享。但是,随着IT技术的迅速发展,以及IT技术应用研究的不断深入,这一问题将得到有效的解决。
  参考文献1王进孝.搜索引擎与网络信息资源检索研究.情报理论与实践,2002,25(4):289—292,3202唐兴华.企业内部隐性知识共享的途径.企业研 究,2001(5):29~303蔡智澄,王颖吾,顾朝晖.囚特网上信息搜索引擎及 搜索技巧.浙江高校图书情报工作,2001(6):27-294常全玲.实现知识管理的最佳方案:综合集成.情 报科学,2000,18(11):976—9775杨涛.中文智能搜索引擎浅析.图书情报工作, 2002(1):62—656吴丹.搜索引擎的智能化研究.情报理论与实践, 2002,25(4):293—2957武助宇,刘文青.中文搜索引擎发展趋势.高校图 书馆工作,2003,26(2):11—138赵丹群.喀碧竹试论搜索引擎的技术改进.情报理 论与实践,2003,26(2):185~186,1819李树合.新一代中文智能搜索引擎尤里卡研究.情报科学,2003,21(1):86~8810耿骞,袁名敦,肖明.信息系统分析与设计.北京: 高等教育出版社,2001.311夏火松,蔡淑琴.企业知识管理的共享机制与知识 树模型.华中科技大学学报,2001,15(4):48—5112周涛.知识管理中的知识流动模型.情报资料工 作,2002(2):28—3013许芳,徐国虎.知识管理中的知识流动分析.情报科学,2003,21(5):548~55214葛新权,李富强.知识共享的企业知识管理系统. 中国软科学,2002(10):56—5915陈金海.基于信息挖掘的知识发现系统.情报杂志,2003(2):15~1616石建,石刚.知识发现在查新咨询中的应用.情报资料工作,2002(1):70~72
  (作者单位:湘潭大学管理学院 湖南湘潭411105)
其他文献
10月16日,被称为“Java之父”的Sun公司副总裁、Sun研究院院士、软件部首席技术官詹姆斯·戈士林(JamesGosling)博士首次来到北京,旨在推进Java技术在中国的发展。JamesGosling是Java技术的创始人,亲手设计了Java语言,完成了Java技术的原始编译器和虚拟机。在京期间,詹姆斯·戈士林着重介绍了Java技术及其业务的最新进展情  Java技术是Sun公司在1995
期刊
2003年11月5日至7日,信息产业部、国家发展和改革委员会、科技部、商务部国务院信息化工作办公室在北京联合主办了“第七届中国国际软件博览会暨软件产业发展成果汇报展”。在展会期间举行的高峰论坛上,信息产业部副部长苟仲文对近年来我国软件产业发展的政策环境、工作进展情况进行了回顾,并提出了今后的工作重点。  一、关于我国软件业发展的政策举措及其推进情况  近年来,国务院为了推动我国软件产业的发展,发布
期刊
本刊讯 由中国信息产业部电子信息产业发展研究院(赛迪集团)、中国信息化推进联盟共同主办的2004中国软件年会于3月23日在北京举行。在本届年会上公布了“2003年度中国软件企业十大领军人物”、“2003年度最具竞争力的中国软件企业’’和“2003年度最具成长性的中国软件企业”的评选结果。   评选结果是:         “2003中国软件产业十大领军人物”:上海畅想电脑有限公司董事长陈刚、长春
期刊
本刊讯 经信息产业部批准,2004年3月24至25日《通信世界》周刊举办了“2004第三代移动通信应用峰会”。本次峰会以“推动3G应用在我国的发展’’为主题,就第三代移动通信的政策、技术、服务、应用等问题进行了深入研究和讨论。  信息产业部科技司副司长张新生、电子信息产品管理司副司长赵波出席了本次峰会,并就3G目前的发展现状、国家对3G发展的政策以及3G的发展等作了演讲。  赵波副司长在会上指出
期刊
1 电子政务生态模型的建构    电子政务生态模型的思维灵感来源于自然界,它模拟了自然界中相互依存的物种适应环境的变化,协调地生存在生态模型中,并共同进化的机制。电子政务生态模型是指以政府、企业和居民的相互作用为基础的在线政务联合体。从广义上讲,它包括隶属于信息支撑层、政策指导层、用户层、技术服务层与核心支撑层在内的5个层次的各类组织与个人。其中,  信息支撑层:各地信息港、国务院各部委信息中心、
期刊
广东省佛山市为解决税务机关人力不足,优化纳税服务,提升地方税收现代化管理水平,从2001年3月开始应用信息化手段将税务、银行、国库、纳税人联网,实现税收申报、数据采集、税款征收、税务管理、税款入库、纳税服务的计算机应用系统,简称为“税银库企一体化工程”。该工程分两期实施,第一期工程完成税务、银行、国库三方联网协同工作(简称“税银库协同工作”),税务申报、征收工作从征收大厅转移到银行网点。第二期工程
期刊
一、进入持续快速发展的新的期    随着国民经济和社会信息化进程的加快,我国信息产业又进入持续快速发展的新时期。电子信息产业正在从单一的制造业转变为物质生产与知识生产,装备制造与系统集成,硬件制造与软件制造,工业生产与信息服务相结合的现代电子信息产业;通信运营业体制改革不断深化,通信能力和水平日益提高;信息产业继续担当国民经济的支柱产业和先导产业的角色,为国民经济和社会信息化建设提供主要技术和物质
期刊
当代图书馆的复合形态以及电子资源和印刷资源并存的状况,对图书馆的信息服务提出了更高的要求。复合图书馆信息服务就是要以用户和服务为中心,建立完备的服务系统,提供充分的、个,,生化的服务。就是将传统的参考服务与专业检索服务结合起来,将馆内服务与远程服务结合起来,将提供式服务与开发式服务结合起来。     复合图书馆登信息用务的定义    图书馆的信息服务是指图书馆将收集到的各种信息进行加工、处理后,利
期刊
黑龙江省科技情报研究所是一家有45年历史的综合科技信息服务机构。近年来,通过对未来发展战略的思考和探索,我所发挥传统优势,以情报研究为主导,重点开展决策性、前瞻性、战略性情报研究,为政府决策提供支撑和服务。同时,还抓住科技部倡导在全国组建生产力促进中心的机遇,在情报所的基础上组建了省生产力促进中心,拓展了科技情报服务的新领域,从而在激烈的市场竞争中争得了一席之地,为进一步的发展奠定了基础。   一
期刊
一、科技竞争力评价指标体系     本文参照《中国科技发展研究报告2000》中有关地区科技竞争力的评价指标体系,对18个城市的科技投入、科技产出、科技与经济和社会协调发展程度、科技潜力4个方面进行了考核。考核中,我们采取科技指标为主、经济和社会发展指标为辅的方法,以科学性、合理性、可比性为原则,形成一套较为完整的科技竞争力综合评价体系。  科技竞争力指标体系的设计 一级指标为“科技投入”、“科
期刊