融合注意力机制与句向量压缩的长文本分类模型

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:renx2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]使用预训练语言模型进行长文本的分类的过程中,目前受到预训练语言模型输入长度的限制而无法有效利用长文本中的所有文本信息。[方法]为在不改变预训练语言模型的条件下充分获取长文本内容特征,设计了依据自然文本中存在的标点符号进行分句并按次序输入预训练语言模型的分类模型。提出了平均池化法与注意力机制加权法对分类特征向量进行压缩编码并在多个预训练语言模型上进行实验。[结果]相比于直接截断文本内容,使用句向量压缩的模型准确率上最多相对提升了3.74%。在两种数据集上融合注意力机制模型的F1-score相比基线模型分别平均提升1.61%和0.83%。[局限]在部分预训练语言模型上提升效果不显著。[结论]实验证明,在不改变预训练语言模型架构且保持原有文本不变的条件下,结合分句内容信息的文本分类模型在不同预训练语言模型上能够有效提升分类效果。
其他文献
学位
学位
学位
学位
学位
学位
在人工智能等技术的驱动下,智慧图书馆将成为未来图书馆发展的新形态,为用户提供具有情境感知能力的智慧服务是智慧图书馆建设的内容和目标之一。面部表情识别是目前一种用途广泛且流行的技术,文章基于面部表情识别,分析不同阅读情境下的读者面部特征,推导读者情感,挖掘情境与情绪的关联,寻找能够激发读者积极情绪的情境组合,这对提高读者阅读体验具有现实意义。首先,通过实地调研,选取空间、光线和音乐三个情境因素作为影
学位
新华社北京9月16日电吴蓉瑾,女,汉族,1974年生,中共党员,上海市黄浦区卢湾一中心小学校长、教师。她传承红色基因、培育红色传人,培养近千名小学生党史讲解员,在学生心中播撒理想信念的种子。她扎根基础教育、潜心教书育人,不断创新德育方法手段,真情守护学生身心健康,有力促进了学生们德智体美劳全面发展。她推动教育公平、促进均衡发展,以实际行动推进优质教育资源均等化,在努力办好人民满意的教育上作出
期刊
学位