一种基于深度学习的实体消歧技术

来源 :南通大学学报(自然科学版) | 被引量 : 0次 | 上传用户:lienkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的命名实体消歧技术通常依靠丰富的上下文语境和外部实体知识库,而很多新兴实体缺乏知识库且包含实体的文本长度较短,这些局限性使得传统算法不能够充分利用上下文的语义信息.另外,由于受有效样本数量的限制,算法最终应用的场景十分有限.基于上述问题,提出一种基于深度学习的结合BERT(bidirectional encoder representation from transformers)模型和长短期记忆神经网络的实体消歧方法.该方法主要包含以下几个部分:1)设计了一种基于BERT模型的词向量,通过较少的数据样本仍然可以获取较多的信息;2)为了让长短期记忆神经网络保留较多的有用信息和验证短文本以适用该方法,对句子样本进行切分;3)结合微软公司提出的NNI(neural net-work intelligence)技术,高效地获取较优的神经网络超参数.通过与其他不同类型的词向量和神经网络技术进行比较,验证了使用文中基于深度学习的实体消歧技术在F-Measure值评测指标上效果更好.
其他文献
利用2015—2019年丽水市283个气象观测站的逐日和逐时资料,采用中国气象局“避暑旅游气候适宜度评价方法”行业标准,在研究避暑旅游气候适宜度时空分布的基础上,运用GIS平台建立不同地形条件下避暑旅游适宜度地理推算模型,对丽水避暑旅游气候适宜度进行区划.结果表明,丽水山地夏季避暑旅游气候适宜等级为很适宜,所占区域居绝对比重.6月丽水各站避暑适宜度为很适宜,以海拔800 m为界,随着海拔高度的升高,适宜度先增后减.7—8月避暑旅游气候适宜度随海拔高度增加而提升,300 m以上为较适宜及以上级别.地理推算模
碳纤维增强树脂复合材料(CFRP)应用市场日益增大,CFRP零部件的广泛应用和产品更新换代带来了废弃物和报废品的处理及环保问题,CFRP回收和再利用技术的研究引起了众多厂商和专家学者的重视。本文综述现有CFRP回收技术和再利用技术的特点、工艺和应用现状,分析常见CFRP部件的成型工艺与适用回收再利用技术的关系,探讨CFRP部件回收再利用技术的技术、供应、法规等问题,展望CFRP回收再利用技术的发展
利用常规和加密气象观测、NCEP再分析、云图等资料,对2010—2019年春季影响大连的温带气旋特征及爆发性气旋造成的极端天气的物理机制进行分析.结果表明:春季进入到渤海、黄海北部的气旋平均每月2.4个;气旋一般先进入黄海,进入黄海和经渤海进入黄海的温带气旋总计有84.5%进入黄海北部,且春季进入黄渤海的气旋73%会给大连地区带来大风或降水天气,影响大连东部沿海的几率远高于其他地区;产生较强灾害性天气的爆发性气旋多发生在春季,路径基本都是由西南向东北方向移动.爆发性气旋主要是因为温带气旋经过黄渤海后短时间
学位