面向机器翻译的藏语功能组块识别研究

被引量 : 0次 | 上传用户:yoyo88420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着藏语基础研究的不断深入、藏语信息处理取得了很大进展。针对藏语语言进行句法分析、语义理解等更深层次的探索逐渐成为目前的研究热点。特别是藏语句法功能组块的研究对于藏语智能化信息处理具有重要的理论价值与现实意义。一方面,从功能组块角度进行句法分析,避免了因藏语自身不确定性和复杂性而造成的完全句法分析效果差的问题,可以作为深层分析的一条可行途径;另一方面,有效的句法功能组块分析能够提升机器翻译、自动问答等应用系统的性能。本文从藏语本身语言特点出发,面向实际藏汉机器翻译系统,开展藏语句法功能组块的识别研究。主要工作如下:1、依据藏语句法功能组块分类标注体系,从现代藏语语言现实情况出发,将功能组块分析任务细化为功能组块边界识别和功能组块类型标注两部分,并结合藏语自身特点,基于条件随机场模型以音节为单位对功能组块边界进行识别。实验F值达到79.12%。2、鉴于以藏语音节为单位进行功能组块分析数据匮乏的现状,引入了分词和词性标注信息,实验结果表明可以进一步将功能组块边界识别F值提升到86.76%。同时开展了多种常见统计机器模型进行藏语功能组块边界识别的对比实验,验证了不同模型对功能组块边界识别的有效性。3、将错误驱动的学习思想引入到组块边界识别研究之中,分别利用基于转换规则的错误驱动学习方法和基于新特征的条件随机场模型识别功能组块边界。进一步提高了边界识别,F值达到94.58%。并基于上述工作基础,完成了功能组块类型标注任务,整体F值达到83.15%。4、将本文提出的藏语功能块研究方法应用到实际藏汉机器翻译系统中,通过具体翻译实例分析,验证了提出方法的有效性和由此识别出的藏语功能块在提高机器翻译结果中所起到的积极作用。
其他文献
随着近几年甘肃省交通运输行业信息化建设的逐步发展和完善,对信息化建设的业务需求逐渐减少,信息化企业面临销售业绩下滑、市场范围缩小的难题。通过内外部环境分析、SWOT分
针对我国国家合唱标准以及实际的演练调整,实现一定的情绪培养,保证必要的音律锻炼的基础的同时,促进必要音准的合理把握,确保适当作品选择的前提下进行必须的适应,达到整体
想泡壶好茶,茶是一方面,壶是另一方面。按照壶的特性,来调整茶性,用壶到这种境界,好茶也就泡成了。我国六大茶类的出现,也使得人们对茶具的种类与色泽,质地与式样,以及茶具的
近来,两部以真实事件改编的韩国电影《熔炉》《辩护人》在其本土掀起巨大波澜,同时也震撼了无数中国观众。两部电影都以小人物的故事为脉络直入社会敏感话题,赤裸裸地揭露现
当前是我国行政体制改革的关键时期,大部门体制成为改革方向。在新的体制下,如何实现政府部门的高效协调运转,健全部门间协调配合机制已成为改革的一项重要内容。本文紧密结
<正> 我矿所产硫化铋精矿的特点是含锡、砷高(Sn 3~4%,As10~15%).为了有效地分离铋、锡和砷,我厂99.99%铋的生产是采用氯盐(三氯化铁)浸出,精矿含铋10%左右,将其浸出液中和而得
在网络舆情分析中,经常要从大量的网页信息中抽取出有用的数据。但一般的网页信息抽取技术都是基于对HTML文档的分析。本文提出网页信息自动抽取的方法,可以滤除网页噪声,快
随着我们国家的教育改革的不断的实现,各个地区办学的规模不断的扩大,学籍的管理工作也越来越繁重,逐渐的变为工作中的不可或缺的一个重要组成部分,学籍管理的好坏能够直接的
随着我国社会经济的快速发展,其计算机技术与通讯技术也得到了更为广阔的发展空间,随着高科技由量到质的逐渐转变,计算机技术与无线通讯技术的相互结合也产生一种崭新的科技
本文介绍了采用西门子S7- 40 0CPU作为本地站、ET2 0 0M作为远程站构成的PLC控制系统在电厂输煤控制系统中的实际应用。