一种多基元联合训练的藏文词向量表示方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:snower2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词向量表示是机器学习的基础性工作,其目标是以优化的向量表示词,以便计算机能更好地理解自然语言。随着神经网络技术的发展,词向量在自然语言处理领域发挥着重要作用。藏文词向量表示技术的研究对藏文特征分析以及用深度学习技术处理藏文具有重要意义。该文提出了一种构件、字和词多基元联合训练的藏文词向量表示方法,设计了多基元联合训练藏文词向量的模型TCCWE,并采用内部评测中的词相似度/相关性评价方式验证了其有效性。实验表明,该文提出的藏文词向量表示方法有效,其性能在TWordSim215上提高了3.35%,在TWord
其他文献
在心理咨询与治疗日益为当代人所接受的同时,其疗效也就成为了从业者研究的热点,当前心理咨询与治疗的流派已近百种,但真正意义上能解决心理问题的方法却少之又少,其原因是疗
根据相关数据统计,近年来,受到高等教育迅速扩招的影响,我国高校毕业的人数从2014年我国高等教育院校毕业人数为727万迅速扩招,到2018年我国高等院校大学生毕业人数的820万,
2011年12月21日至1月20日,国家计算机网络入侵防范中心发布漏洞总条目为327条,为2011年12月发布漏洞总数的1.01倍,基本持平。其中威胁级别为"紧急"的有56条,"高"的有48条,"中"的有191条,"低"的有32条。威胁级别为紧急和高的
1计算机病毒总体情况2012年2月,国家计算机病毒应急处理中心共发现病毒691568个,比1月上升14.3%,新增病毒103774个,比1月上升9.5%,感染计算机34184670台,比1月上升5.8%,主要传播途径仍以"网络钓鱼"和"网页挂马"为主。2计算机病毒动态1)2月部分汉化版本的SSH软件被恶意攻击者添加后门功能,对我国信息系统和网站的安全造成一定威胁。恶意攻击者首
根据中国工程建设标准化协会《关于印发〈2017年第一批工程建设协会标准制订、修订计划〉的通知》(建标协字[2017]014号)的要求,由中国建筑科学研究院有限公司、贵州中建建筑
2009年,公安部、中宣部、中央外宣办、工业和信息化部、卫生部、国家工商总局、广电总局、国家食品药品监管局、银监会九部委决定在全国范围内组织开展打击整治网络淫秽色情
拼写检查能够快速检测文本错误,提高文本校对效率,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。该文在分析藏文拼写检查技术和语言模型的基础上,
涉案舆情新闻文本摘要任务是从涉及特定案件的舆情新闻文本中,获取重要信息作为其简短摘要,因此对于相关人员快速掌控舆情态势具有重要作用。涉案舆情新闻文本摘要相比开放域
食饮理论的形成发展有着悠久历史,与《黄帝内经》成书差不多同时期的"三礼"则对上古食饮的规范叙述详细,但随着以儒家文化为基础的传统文化的衰落,食饮中有关"礼"局面的日趋混乱,