不平衡训练数据下的基于深度学习的文本分类

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:xxuhhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类别的训练数据不均衡时,训练得到的神经网络模型会由多数类所主导,分类结果往往倾向多数类,极大影响了分类效果.针对这种情况,本文在卷积神经网络训练过程中,损失函数引入类别标签权重,强化少数类对模型参数的影响.在复旦大学文本分类数据集上进行测试,实验表明本文提出的方法相比于基线系统宏平均F1值提高了4.49% ,较好地解决数据不平衡分类问题.
其他文献
目的 探究共刺激信号分子(CD80、CD86)表达水平与免疫性血小板减少症(ITP)患者免疫功能的相关性.方法 纳入初诊ITP患者60例(初诊组),另取完全缓解患者45例(缓解组),健康志愿
目的 分析2017-2018年滨州市病毒性腹泻的流行病学及病原学特征,为制定预防控制策略提供科学依据.方法 2017年4月至2018年12月从滨州市7家监测哨点医院收集感染性腹泻患者的
世界卫生组织列出的常见热带病中绝大部分是由寄生虫感染人体导致的,如疟疾、利什曼病、血吸虫病、丝虫病、恰加斯病等,这类热带疾病常常被忽视,也是威胁一带一路国家公民健
目的 分析2013-2017年攀枝花市人免疫缺陷病毒(HIV)抗体阳性者流行特征及Western bolt(WB)带型,为艾滋病的精准防控提供科学依据.方法 收集并分析HIV抗体阳性者的性别、年龄
复杂网络中的链接预测已经在物理学和计算机科学界引起了越来越多的关注.链接预测算法可用于提取缺失信息、识别虚假交互、评估网络演化机制等.本文全面总结和分析了链接预测
目的 探讨外周血中性粒细胞与淋巴细胞比值(NLR)、降钙素原(PCT)联合终末期肝病模型(MELD)评分在乙型病毒相关慢加急性肝衰竭(HBV?ACLF)继发感染中的诊断及短期预后预测价值.
目的 调查分析深圳市龙华区1起由人偏肺病毒(hMPV)引起的急性呼吸道感染暴发疫情的流行特点和发生原因,为防控相关疫情提供参考.方法 对病例报告学校开展流行病学调查;采集患
目的 探讨慢性阻塞性肺疾病(COPD)患者不同时期血清脂质运载蛋白-1(LCN?1)、脂质运载蛋白-2(LCN?2)的表达水平及临床意义.方法 选取2016年9月-2018年9月在新乡市第一人民医院
目的 比较糖尿病合并肺结核与单纯肺结核患者血清细胞因子水平、临床疗效和转归,分析其相关性,并探讨相关影响因素.方法 选取2016年1月至2018年1月在新乡医学院第一附属医院