一种基于LSTM的端到端多任务老挝语分词方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wulanshaobu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
老挝语是一种无空格切分的字母语言,在进行自然语言处理工作时需要首先进行分词处理.现有分词算法主要为首先使用规则进行音节切分,然后根据音节切分结果进行老挝语分词,存在错误传递等问题.该文提出一种基于神经网络的端到端老挝语分词方法,基于多任务联合学习思想,将老挝语音节切分与分词工作进行结合,实现了基于双向长短时记忆循环神经网络(BiLSTM)的端到端老挝语分词模型.实验表明,端到端的老挝语分词模型准确率达到89.02%,较以往分词模型有所提升.
其他文献
大亚湾海事处在党史学习教育中,扎实开展“我为群众办实事”实践活动,将党史学习教育与监管业务深度融合,把解决基层海事实际问题作为出发点与落脚点,发挥党建引领和桥梁纽带作用,实现安全监管与海事服务的“双融合”.以严格监管服务大亚湾石化区的安全生产,有力保障了地方经济的安全、高速发展.同时聚焦船员群体、港航企业反映集中的普遍性问题,通过优质的服务拉近与被监管对象的距离,营造良好的监管氛围,极大提高监管效率.
期刊
在分析中低压开关柜常见弧光保护方案、总结现有弧光保护方案存在问题的基础上,提出一种基于GOOSE(通用面向对象变电站事件)通信的中低压系统弧光保护无死区控制方案.通过建立弧光保护装置与所有间隔层综合保护装置共有的GOOSE网络,实现弧光保护与间隔层综合保护装置的信号传递.该方案可以实现母线区和间隔区的弧光保护,而且可以实现断路器与TA(电流互感器)死区之间发生弧光故障时的快速保护.弧光信号传输光纤敷设在柜内完成,大大减少了弧光信号传输光纤敷设施工量,通过GOOSE网络实现跳闸信号传递可以有效减少电缆的敷设
横山村为省定贫困村,通过交通运输部珠江航务管理局五年的帮扶,交通硬件设施、文体医疗设施、人居环境明显改善,村集体有稳定收入来源,扶贫产业从无到有,美丽乡村建设日新月异,文化扶贫开花结果,在脱贫攻坚的征程中稳步奔向小康社会.
期刊
“后潮叠前潮,大潮叠旧潮.”在惊涛骇浪中紧紧抓住船舷,任凭全身被海水浇透,这就是上世纪80年代测量人员在风浪中的真实写照.今年58岁的王锦庆,是广航局的一名资深测量人,18岁入伍到部队成为一名海测兵,后来退役到广航局从事港口工程测量工作.虽然期间他也有短暂的岗位调整,但是直到2019年才正式离开他热爱的测量事业.30多年的测绘生涯,王锦庆用脚步测量祖国的海岸线,用具体行动坚守廉洁底线,书写了一名中交疏浚职工的初心故事.
期刊
以廉兴文,以文载道.廉政文化,是社会主义先进文化的重要组成部分,是廉政建设结合文化建设的产物.我国进入新发展阶段后,对廉政文化建设质量提出了更高的要求.加强廉政文化建设,树立党员干部廉洁从政理念、提高廉洁从政意识、规范廉洁从政行为,是新时期深入推进党风廉政建设、加大反腐败斗争的必要举措.通过丰富多彩的形式和方法,加强廉政文化建设,有利于推动党员干部廉洁从政,以更好地在全社会营造学廉、崇廉、尚廉的良好氛围.
期刊
惠州大亚湾海事处是大亚湾水上交通安全监督管理机关,辖区有着危险品数量多、大型油轮数量多等特点.多年来,在大亚湾海事处的严格监管下,辖区从未发生等级以上水上交通事故.大亚湾海事处如同一尊“守护神”一般,保障着大亚湾石化区一步步成长为世界级绿色石化产业基地.
期刊
光伏发电功率预测是光伏发电规划和电网经济运行的重要基础.针对K-means算法无法确定最佳聚类数和聚类结果不稳定的问题,以及GBDT(梯度提升树)预测结构简单、预测精度低的缺点,提出集成聚类和XGBoost的组合预测算法用于构建短期光伏发电功率的预测模型.首先,采用Mean-shift(均值漂移算法)、凝聚层次聚类算法和DBI(戴维森堡丁指数)优化K-means算法,解决了无法确定最佳聚类数和聚类结果不稳定的问题;其次,在集成聚类得到的聚类结果数据上,训练得到不同气象类型下的XGBoost预测模型,以此来
针对构建朝鲜语语料库的人工标注工作过于费时费力,少数民族语言难以与各家资源融合的这一问题,该文从表征学习的角度,意图构建有效的朝鲜语句子结构表示,用来提升后续自然语言处理任务的效果.我们将深度强化学习与自注意力机制相结合,提出了一种分层结构的自注意力模型(Hierarchically Structured Korean,HS-K).模型利用强化学习中的Actor-Critic思想,将文本分类效果作为强化学习的标签反馈信息,把文本的结构划分任务转化为序列决策任务.实验结果表明,模型可以识别出接近人工标注的朝