东盟十国新闻文本的命名实体识别

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:cat521kiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型,对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征;再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法,对文本进行更加科学合理的划分。在东盟十国数据集上,将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥
其他文献
职业教育如何提高其办学质量是广大职业教育者都在积极思考和探索的问题。以工作过程为导向的专业教学改革能很好地解决目前职业教育的困境。
随着我国图书馆事业的继续发展,图书馆工作的不断拓展,作为图书馆存在基础和发展动力的图书馆员,应进一步认识知识和信息的关系、读者的权利和义务的关系以及图书馆工作的职业价
为提高车载双目系统户外工作性能,提出了一种车载双目系统立体匹配算法。在代价计算阶段,提出了一种3bitCensus变换,该变换提高了对局部特征的描述能力并具有较强的鲁棒性;在代价聚合阶段,提出了基于边缘截断的自适应窗口聚合算法,该算法能够根据局部特征和边缘信息自适应的调节聚合窗口,提高了算法匹配精度;在视差计算阶段,利用跳跃式视差计算方法,进一步提高了计算效率。实验证明:基于3bit-Census
关节极限及机械手臂的奇异位形的限制,往往导致协调任务失败。通过对冗余双臂机器人的研究,利用冗余手臂的自运动特性并基于梯度投影法及奇异鲁棒性求逆法完成了冗余手臂的避
利用HotDisk热常数分析仪对四氢呋喃(THF)水合物导热系数和热扩散系数进行了非原位测量。实验结果表明,温度在254.0~267.0 K时非原位测得的THF水合物导热系数为0.52~0.57 W&#