跨汉蒙语文信息检索中的查询项翻译方法研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:kasuo11111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的发展,全球互联网用户快速增长,网络信息资源语种也日益多样化,跨语言信息检索已成为越来越重要的研究课题。   在汉英等语言的跨语言检索方面已经有很多研究成果。但是,在蒙古语相关的检索方面所进行的研究工作还比较少。蒙古文是世界上很有影响力的语言文字,因此蒙古文信息检索的研究具有非常重要的意义。   由于汉语查询项翻译的好坏直接影响到检索的效果,因此我们结合知识和统计的方法,解决汉语查询项到蒙古语查询项的翻译。在本文中,我们采用中科院ICTCLAS工具对汉语查询项中音译的外来语借词和人名、地名等专有名词的进行识别;提出了新的短语切分方法,将短语切分概率化,并将生成的概率模型和句子长度全部引入到翻译模型中,最后进行解码。   实验结果表明,引入短语切分模型,加上命名实体和借词的识别,使翻译质量有明显提高,实现了查询项的翻译。
其他文献
云计算作为新兴的一种计算模式,它以互联网为基础,以服务的方式对外提供计算能力。它将网络上的各种资源整合成一个分布式服务集群系统,为用户提供可以缩减或扩展的计算资源。计
随着信息社会的不断发展,人们对信息的需求量逐渐增多,Web上拥有大量的信息资源,它逐渐成人们获取信息的重要途径。然而,由于不同的网站使用的数据往往具有不同的数据格式,所
随着信息化迅速推广和普及,导致各行各业基础信息量成几何倍增。海量存储和大并发成为主流大型数据库的标记。同时异地、跨行业的数据库服务器之间的数据信息交换、交互的诉
随着信息技术的迅猛发展,在网络监控、电信数据管理和金融服务等领域源源不断地产生新数据。具有海量、连续、多变及潜在无限性等特征的数据流不仅为数据存储带来挑战,也加大
稀疏矩阵向量乘(SMVM)运算是许多工程计算与科学计算的核心,近年来随着FPGA的广泛应用,基于FPGA平台的SMVM运算研究工作也在不断地深入。针对FPGA特有的并行性,研究者们提出
Internet的开放性和共享性环境给人们带来了便利,网上购物逐渐深入人们的生活,由此,电子商务得到飞速的发展。但是,近年来电子商务的发展频繁受到各种安全隐患和不诚信因素的
微数据是指与个体相关的数据,如人口统计数据、客户购物数据、患者医疗数据等,这些数据在趋势分析、市场预测等应用中具有重要的价值。但是如果直接发布或共享微数据会泄漏大
随着软件规模的逐渐增大,软件测试在整个软件开发过程中占有非常重要的地位,是保证软件质量、提高软件可靠性的关键。随着Internet的迅猛发展,分布式系统大量涌现。新一代电
随着互联网的高速发展,网络协议标准也不断地更新和完善。如何更有效地提高网络服务,已成为网络协议工程领域的关键问题之一。层次移动IPv6协议作为移动IPv6协议的扩展,在移
随着投影以及多投影技术在现实生活中各个领域内的广泛应用,传统的只针对于特定投影表面或投影幕的多媒体投影技术已经远远不能够满足现实应用中的特定要求。本文中提出了一种