藏文语料库深加工方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：weicun_weicun

【摘要】

：

随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期

【作者】

：

才藏太

【机构】

：

青海师范大学计算机学院

【出处】

：

计算机工程与应用

【发表日期】

：

2012年26期

【关键词】

：

藏文语料库分词标注分词词典还原算法 Tibetan corpus segmentation and tag segmentation dictiona

【基金项目】

：

国家973计划项目（No.2010CB334708）,国家自然科学基金（No.61163018）,青海师范大学仓蚓谨金项目（No.2011-Z-754/2011-Z-755）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。

其他文献

纳米材料的穆斯堡尔谱学研究

采用液相化学方法并结合热处理及高压等手段制备了纳米材料样品，利用穆斯堡尔效应，X射线衍射和电子显微镜对样品进行了分析，得到了一些有关纳米材料特殊的有意义的结果。

期刊

纳米微粒特性纳米晶体结构磁激发效应穆斯堡尔学

对社会主义必然胜利的若干认识

社会主义是历史发展的必然规律.具有"与时俱进" 的理论品质是取得社会主义胜利的根本要求;发展社会主义必须坚持改革,解放和发展生产力;坚持四项基本原则是社会主义必然胜利

期刊

社会主义历史命运认识"与时俱进"改革开放"三个代表"解放思想实践socialism inexorable

多传感器信息融合技术在光电经纬仪系统中的应用研究

经纬仪系统是一个比较复杂的多传感器系统,多传感器信息融合(Multi-seneorDataFusion)是把多种传感器中于一个统一的感知系统(这个感知系统就是多传感器信息融合系统)中,从而有机地综合利用多个传感器来的数据和信息,以便获得对周围环境的更多或更准确可靠的认识.研究多传感器信息融合技术在经纬仪系统中的应用,可以提高仪器的可靠性和自动化程度,以及跟踪精度和实时输出精度.

期刊

多传感器信息融合光电经纬仪系统感知系统电视自动跟踪测量系统optical-electronic theodolite multi-sensorin

NSCT变换与改进PSO算法在含噪图像分割中的应用

为提高含噪图像的分割效果和分割速度,将非下采样Contourlet变换和粒子群优化算法相结合,提出了一种有效的图像分割方法——IPSOC。该方法首先对待分割图像进行多尺度非下采样Contourlet变换,然后利用其最高级低频系数重构图像,计算重构图像与其均值图像的二维直方图中类间离散度矩阵的迹,并以之作为分割图像的目标函数来搜索最佳分割阈值。为加快阈值搜索速度,以改进的粒子群优化算法作为阈值分割的

期刊

图像分割含噪图像非下采样CONTOURLET变换改进PSO算法image segmentation noise image Nonsubsample

高学识人群“亚健康状况”的预防与治疗——对大学生心理问题的重新剖析及学校对策

对当代大学生心理疾病的问题，在治疗患者同时要对正常人群以预防．“心理健康教育”课并设为大学必修课。学校成立“心理健康指导组”并建立“学生心理健康档案”．完善高校大学生

期刊

心理健康指导挫折教育自我凋解psycho- health guide frustration education self- regulation

浅谈高校体育教学中的素质教育

对高校体育在案质教育的地位和作用进行了论述，并提出了在高校体育教学中如何加强素质教育．

期刊

高校体育素质教育教学the physical culture of the university quality-orented education

试论高校图书馆与校园文化建设

论述了图书馆在校园文化建设中的作用关系,探讨了在市场经济条件下图书馆参与校园文化建设的方法与途径.

期刊

校园文化高校图书馆市场经济

藏文语料库深加工方法研究

与本文相关的学术论文