基于半监督与词向量加权的文本分类研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:qq104397622
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本分类领域的有监督学习往往需要大量精准标注样本但大量人工标注困难的问题,提出一种新型的半监督学习方式,通过协同训练合理使用大量未标记训练样本,通过添加不同分类的文本特征噪声解决传统协同半监督学习方法中模型参数趋于统一的问题,同时提高分类模型的分类能力。针对传统深度学习方法中文本特征权重一致导致的分类特异性特征不突出问题,在训练模型中加入self-attention机制对文本句子特征权重进行提取,并通过句子加权方式突出特异性分类特征。实验结果表明,通过半监督学习方式同时使用少量已标注数据进行训练,模型
其他文献
中国现代化科学技术不断创新升级,依托于现代信息技术的数字信号处理技术也得到了创新发展,在电子信息工程中应用数字信号处理技术优势,即能够有效提升技术能力,促进中国先进
地方高校在开展教学和科研工作、为国家培养创新型人才、服务地方经济社会建设发展等方面发挥着至关重要的作用,扮演着重要角色。科学研究能力一直以来是高校进步发展和提升
为了更好地培养服务地方经济的专业技术人才,桂林理工大学生物工程专业将工程教育专业认证融入到人才培养方案修订过程中。通过调研已认证的高校,了解区内相关企业对人才需求
目的探讨颅脑创伤急诊综合护理干预的效果。方法择取2018年1月—2019年8月期间该院收治的60例颅脑创伤患者作为研究对象,以数字表法进行随机分组,包括对照组(n=30)和观察组(n
为了改善图像模糊给生活带来的不便,基于乘子交替方向法(ADMM)对图像恢复问题进行研究。图像作为一种重要的信息载体,在生活各个方面都显得尤为重要,但图像退化导致的模糊问题始终是困扰其正常发挥作用的重要因素。ADMM在处理线性逆问题方面有着良好效果,然而在很多实际应用中,无法保证算法能够高效且高质量地恢复图像。为此,提出一种改进ADMM算法,在x子问题和z子问题中引入新的松弛参数,使得每次迭代步长大
交通标志是规范驾驶员驾驶的重要指标信息,如何检测交通标志是无人驾驶和辅助驾驶中的关键一环。利用PYQT开发一套基于深度学习的交通标志检测系统,系统包括4个主要模块:用户信息模块、摄像头采集模块、检测模块和保存结果模块。对比目前主流的深度学习目标检测算法YOLOv3和Faster-RCNN在交通标志上的检测效果,并采用YOLOv3作为系统仿真算法,仿真结果表明,YOLOv3兼顾了实时检测和检测精度要
儿科是临床医学学科中实践性强、疾病病种多、专业知识面广的一门学科。该专业对临床医学生的要求较高,既要求掌握儿科各病种的理论知识,又要求学生将所学知识应用到临床病患
为了提高个人信用评分模型算法预测精准率,受视觉领域数据增广思路启发,提出融合数据增广技术与机器学习算法的个人信用评分模型。该模型首先对原始个人信用数据进行数据增广
针对用户使用搜索引擎输入关键词查询信息时,由于输入法的原因或者不小心输入错误关键词等,致使搜索结果不符合用户预期的问题,提出基于搜索引擎日志的中文纠错方法。首先对