基于法律文本的藏语句子边界识别

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户:sxj007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统藏语书写中标点符号的特殊性,在藏语句子中如何找到正确的句子边界,是正确识别句子的首要问题。本文通过对藏语法律文本语料的观察,利用规则提出了一个藏语句子边界的识别算法。同时对藏语法律文本的句式特点进行初步的分析和探讨。
其他文献
@@妊娠期妇女体重增加值超过推荐范围,可能产生各种不利于母体的影响,如增加妊娠期高血压,妊娠期糖尿病,分娩过程中的并发症,产后体重滞留或母体肥胖的风险,也会增加产后母乳喂养失
会议
@@用IOM(BMI>26)或WHO(BMI>25)的标准,1999-2004年美国12-44岁非孕妇女约半数超重。国家卫生统计中心(NCHS)1999-2004年的数据表明,几乎2/3的育龄妇女超重(BMI≥25kg/m2),其中近
会议
@@研究显示,当今育龄妇女的数量比以往任何时刻都要多,且其中大部分妇女没有制定完善计划来保证孕前健康体重、孕期增重控制以及产后体重恢复。同时,高能量低营养密度的食物消耗
某日下午,台湾传媒界超级女强人曹又方和上海文坛人人皆知的著名女作家陆星儿共同出现在上海青海路休闲街上的鹦鹉咖啡馆里。双方都是慕名而来,但慕名的原因并非是她们的作品
@@孕期增重(Gestational weight gain,GWG)是一个特殊而复杂的生物学现象,它维持着胎儿的生长与发育功能。孕期增重不仅受母体生理和代谢改变的影响,也受胎盘代谢的影响。胎盘充
会议
女书是中国湖南省江永县流传的世界上唯一的女性专用文字,是人类文明的一朵奇葩,目前正在申请世界非物质文化遗产。女书研究的发展对女书数字化提出了迫切需要。 女书输入法
会议
MWord是一种集文本、表格、图形、图象处理于一身的字处理软件,它采用OpenType字库技术和Uniscribe布局引擎解决了Windows环境下蒙古文编码国际标准的实现问题。 本文重点
会议
命运负责洗牌,但是玩牌的是我们自己。当年正值十七八岁的关键目光坚定地望着父母说“我要参军,当飞行员”时,所有人意外之余,也感受到这个平日乖顺的孩子体内潜伏着的那份能
针对传统基于短时能量和短时过零率的端点检测方法中存在的对清音检测性能以及抗噪声性能较差的缺点,结合维吾尔语的声频发音特征,提出了一种计算较为简单,受噪声影响较小的语音
本文旨在研究如何基于题材和感情,试对唐诗文本进行自动分类,即对现行的通用文本分类算法,做基于唐诗文本的比较实验和参数微调。本文的目的在于初步试探唐诗自动分类算法,发现算