跨语言信息检索在机器人信息数据库中的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:LCW8889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索(IR)泛指用户从包含各种信息的文档集中找到所需要的信息或知识的过程。传统的信息检索系统主要是针对单一语种的文档集实现,一般是使用用户最为熟悉的语种作为查询语言。随着互联网的全球化发展趋势,用各种语言书写的信息汇聚在一个集合中,使系统提供对多语种文献进行同时查询的需求变得越来越迫切,由此而引发了信息检索界对跨语言信息检索的研究。 跨语言信息检索(CLIR)即用一种提问语言检索出用另一种语言书写的信息,是一种跨越语言界限进行检索的问题。在当今信息社会中,跨语言信息检索已成为世界范围内一个亟待解决的关键问题。Internet的全球信息基本结构造成针对跨语言信息检索系统的需要愈来愈强烈。因特网上,大约80%的网站是英文网站,而将近40%的因特网使用者不会英文。在这种情况下,如果用户能够以本国语言输入查询,进行跨语言检索,得出所需检索的各种语言的文本,将会受益非浅。 上海交通大学建立的机器人信息数据库属CALIS项目中的机械制造及自动化文献数据库中的子库,其内容着重于1986年以来国内外出版的各种中英图书、期刊、会议录、科技报告、专利产品等文献中有关机器人方面的文献资料、科技成果和产品信息。数据库采用TRS信息发布检索系统进行构建,该系统是由易宝北信信息技术有限公司开发的一个面向文本数据的数据库管理系统。本文的研究正是基于机器人信息数据库的。 本文旨在对跨语言信息检索的理论进行研究,以专业性很强的机器人信息数据库作为一个研究的平台,提出一种适用于专业数据库的跨语言信息检索模型,并根据所研究的理论模型,建立跨语言检索系统。系统基于机器人信息数据库建立中英双语语料库,在前端建立双语词典,实现查询翻译,消除歧义,后端加入反馈机制,以完善双语语料库。用户的查询通过字典、语料库进行翻译,在TRS全文检索系统的基础上实现对机器人信息数据库的跨语言信息检索。 跨语言信息检索的研究涉及到语言学、情报学、计算机科学等多门学科知识,是一个综合性强、富有挑战性的研究领域。本文的研究对于如何在专业领域数据库中构建跨语言信息检索系统具有一定的借鉴意义。
其他文献
本课题将科学计量学的研究方法与可视化技术相结合,通过对交叉学科期刊与专业期刊进行比较研究,看交叉学科的发展趋势。 本课题对2000——2004年国内外共17种医学、哲学、医
随着知识经济的迅猛发展,知识管理逐步得到重视,尤其得到了众多软件企业的青睐。相对于传统行业,软件企业在实施知识管理战略中,许多方面都拥有先天优势,但最后真正实施成功的企业
图书馆云信息服务等级协议(ISLA)通过量化参数以客观地测量服务的质量。综合云QoS参数管理的形式及典型的SLA参数,结合DigiQUAL+TM的研究方法,参考QoS的4个审视角度,以环境质量、交互质量与感知质量维度为研究对象,构建图书馆云服务质量概念模型,并通过实证来检验与修正概念模型。研究结果发现,服务透明度、资源安全、响应速度、服务时间、共享性、合作性、责任管理和保障管理是ISLA的关键参数
Internet的发展和普及给人们带来了空前丰富的信息资源,一方面满足了用户对信息资源的广泛需求,同时也使用户陷入信息的海洋中无法自拔,数量繁杂无序的信息与不同用户特定的个性
建国后我国图书馆发展战略思想的演进,既与国家的发展战略息息相关,也与广大读者的需求紧密相连。考察其具体的演进过程,不但可以了解图书馆事业在各个阶段的发展情况,而且可
小学教育是不断的培养智慧型人才,促进我国教育事业发展的重要途径。有效的、科学的教育管理对教学质量具有重要的积极作用。对教育教学管理方式不断的创新可以为小学教育尤其
用户教育是高校图书馆的一项重要工作,它担负着对高校图书馆用户的教育和培训任务。在当前的网络环境下,高校图书馆的信息环境、服务方式和用户需求的改变导致了用户对信息资源
分析国内外公益数字文化建设运行理念的异同。提出我国公益数字文化建设需要完善政策法规支撑体系,加大投入力度,构建专项资金管理制度、转移支付制度等多级财政保障制度,合
传媒企业是以生产“知识产品”为主的企业。在知识经济时代,知识管理的实施直接关系到传媒企业核心能力与竞争优势的提升。本文首先通过对传媒企业的管理方式、核心能力以及价
通过相关案例的调查确定图书馆数字资源引进后合作管理的内容主要包括:资源评估的合作、资源保存的合作以及资源目录建设的合作,并对引进后的合作管理方式进行归纳和分析。其