融合注意力机制与句向量压缩的长文本分类模型

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户：renx2000

【摘要】

：

【作者】

：

叶瀚孙海春李欣焦凯楠

【机构】

：

中国人民公安大学信息网络安全学院

【出处】

：

数据分析与知识发现

【发表日期】

：

2020年01期

【关键词】

：

文本分类预训练语言模型特征向量注意力机制文本分割

【基金项目】

：

公安部技术研究计划基金项目“融合事理图谱与知识图谱的电信诈骗领域知识问答应用系统”（项目编号：2020JSYJC220k）；北京市自然科学基金项目“融合时空拓扑结构的案件语义模型构建与分析”（项目编号：4184099）；中国人民公安大学基本科研业务费基金项目“面向海量警情和案件笔录数据的认知理解和关系挖掘技术研究与应用

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

[目的]使用预训练语言模型进行长文本的分类的过程中，目前受到预训练语言模型输入长度的限制而无法有效利用长文本中的所有文本信息。[方法]为在不改变预训练语言模型的条件下充分获取长文本内容特征，设计了依据自然文本中存在的标点符号进行分句并按次序输入预训练语言模型的分类模型。提出了平均池化法与注意力机制加权法对分类特征向量进行压缩编码并在多个预训练语言模型上进行实验。[结果]相比于直接截断文本内容，使用句向量压缩的模型准确率上最多相对提升了3.74%。在两种数据集上融合注意力机制模型的F1-score相比基线模型分别平均提升1.61%和0.83%。[局限]在部分预训练语言模型上提升效果不显著。[结论]实验证明，在不改变预训练语言模型架构且保持原有文本不变的条件下，结合分句内容信息的文本分类模型在不同预训练语言模型上能够有效提升分类效果。

其他文献

国内外中医期刊论文英文摘要中模糊限制语使用对比研究

学位

人际交往能力、院校支持对农村籍大学新生适应性影响研究

学位

学位

学位

学位

学位

基于面部表情识别的阅读情境匹配与体验优化研究

在人工智能等技术的驱动下,智慧图书馆将成为未来图书馆发展的新形态,为用户提供具有情境感知能力的智慧服务是智慧图书馆建设的内容和目标之一。面部表情识别是目前一种用途广泛且流行的技术,文章基于面部表情识别,分析不同阅读情境下的读者面部特征,推导读者情感,挖掘情境与情绪的关联,寻找能够激发读者积极情绪的情境组合,这对提高读者阅读体验具有现实意义。首先,通过实地调研,选取空间、光线和音乐三个情境因素作为影

期刊

智慧图书馆面部表情识别阅读情境

LED光质对臭菜生长特性及营养品质影响规律研究

学位

中共中央宣传部关于授予吴蓉瑾、王红旭同志“时代楷模”称号的决定

新华社北京9月16日电吴蓉瑾,女,汉族,1974年生,中共党员,上海市黄浦区卢湾一中心小学校长、教师。她传承红色基因、培育红色传人,培养近千名小学生党史讲解员,在学生心中播撒理想信念的种子。她扎根基础教育、潜心教书育人,不断创新德育方法手段,真情守护学生身心健康,有力促进了学生们德智体美劳全面发展。她推动教育公平、促进均衡发展,以实际行动推进优质教育资源均等化,在努力办好人民满意的教育上作出

期刊

互联网金融消费者权益保护研究

学位

融合注意力机制与句向量压缩的长文本分类模型

其他学术论文