基于LUCENE的藏文信息检索的研究与应用

来源 :第十一届全国民族语言文字信息学术研讨会 | 被引量 : 0次 | 上传用户:zzyp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文探讨了基于LUCENE的藏文信息检索实现方法,采用LUCENE的技术框架加入处理藏文信息的技术,从而实现藏文信息检索.
其他文献
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方
本文给出了ISO国际标准《语言资源管理:面向单语种和多语种书面语信息处理的分词──第一部分:一般原则与方法》中的核心概念体系,以期征求意见并改进之。
本文主要介绍了《蒙古语及三少民族语言语料库资源管理平台》建设课题的研究背景和内容,提出了蒙古语及三少民族语言资源管理平台的建设目标和规划,主要包括《蒙古语语料库语
本文针对民族语言消亡现象日趋紧迫的现状,提出采用多模态语料库进行濒危语言抢救的方法.首先比较了文本语料库、语音(口语)语料库和多模态语料库,指出多模态语料库在语料内
本文通过多方面的分析,提出了古维吾尔文(察合台文)文献数字化整理系统构建中察合台文的转写为现代维吾尔文所需要的关键技术、基于UNICODE的转写符号方案.初步探讨了察合台
目前语块库的构建越来越受到重视,但对语块标注和部分句法分析的研究还比较少,对双语语块的研究则更少。这样,在构建双语语块的过程中,势必会遇到一些问题,这些问题很难用一
本文阐述了汉文-维吾尔文双语对齐语料库的构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法。本文所实验的语料库收集汉文-维吾尔文双语句子对齐语1000
本文主要研究如何在Linux操作系统OpenSource的开发模式下实现藏文的处理.其主要研究内容包括设计实现目标,分析设计结构模块及选择内码、设置本地化环境、开发输入法、本地
本文提出了一个基于规则的哈萨克语词干提取的一种解决方法。该方法首先找到待切分词的所有可能的词干,然后以带变形词的词典和分类的附加成分表为基础,对找到的若干个词干进
本研究利用表型性状探讨了浙江省沿海地区16份豌豆地方品种资源的遗传多样性。结果表明:26个数量性状的变异系数在2.72%~100.25%之间,24个质量性状Shannon-wiener遗传多样性指