【摘 要】
:
藏文分词是各类藏文自然语言处理的首要任务,藏文分词的性能直接影响下游的其他自然语言处理任务的性能。传统上多数研究者使用线性统计方法进行藏文分词的研究,但是此类方法
【机 构】
:
青海师范大学藏文信息处理教育部重点实验室,青海省藏文信息处理与机器翻译重点实验室
【基金项目】
:
国家自然科学基金(61662061,61063033);国家重点研发计划(2017YFB1402200);青海省科技厅项目(2015-SF-520)
论文部分内容阅读
藏文分词是各类藏文自然语言处理的首要任务,藏文分词的性能直接影响下游的其他自然语言处理任务的性能。传统上多数研究者使用线性统计方法进行藏文分词的研究,但是此类方法需要大量人工设计的语言学特征。研究提出了一种藏文分词的神经网络构架,这种构架只需监督式训练的标注数据和无监督学习嵌入表示的未标注语料,而无需介入人工特征工程。通过对CNN、BiLSTM、和CRF三种网络的有效组合,使分词模型在测试数据集上的准确率、召回率和Fi值分别达到了93.4%、94.2%和94.1%,超越了各类基准模型的表现。
其他文献
目的:对治疗SARS的主要中西医结合方案进行比较,评价其治疗效果。方法:采用非线性加权综合法。结果:得出了7个治疗方案治疗效果的综合评价排序。结论:综合评价是对多指标多属
<正> 怎样完整的记录出入量,是护理工作的基础。准确无误地记录,为治疗提供可靠的数据。本文从体液平衡的生理,叙述了准确记录出入量的重要性及方法。一、体液平衡的生理1.水
经济增长是社会发展的物质基础和前提保障,财政支出是政府进行宏观调控经济发展最重要的手段,财政支出和经济增长的关系紧密相连。随着我国财税体制框架的建立和改革的逐步推
随着市场经济的不断发展,设备监理在重大设备工程建设中的重要性愈发不可或缺,设备监理防控质量风险的作用也被人们逐渐关注。本文介绍了设备监理工作中开展质量风险防控的基
"十三五"时期,是阿合奇县贯彻落实中央、自治区和地州脱贫攻坚期会议精神及脱离贫攻坚工作安排部署,打赢扶贫攻坚战的关键期。准确了解分析阿合奇县致贫原因、找准靶向、精准
全方位设备监造技术体系是以设备质保分级和风险辨识为基础,综合运用见证、巡视监督、质保专项检查、平行检验等综合控制技术对设备制造过程中的质量风险点进行监测,促使设备
本文针对在国库集中收付改革中面临的报账非均衡性和报表非规范性问题,从报账员的素质、预算单位领导的重视程度和制度三个方面进行了系统分析,并提出解决问题的相应对策。
论文介绍了某高性能数据中心空调系统采用闭式冷却塔+水冷磁悬浮冷水机组的设计方案以及节能运行模式,并给出了运行模式间转换温度的确定方法。研究表明:采用此方案后,可充分
<正>作为建筑设计的专业机构,中南建筑设计院股份有限公司(以下简称中南院)经历了60年的风雨,一直在现代中国急剧变化的市场中固守自己的淡泊精神,传承自己的严谨风格;几代设
为了筛选出适用于苹果高效抗缺铁栽培的理想砧木品种。本研究选取了5种常见的苹果砧木为研究对象,采用溶液培养、砂基培养和田间栽植观察的方法相结合,通过对不同苹果砧木的