【摘 要】
:
针对单一的情感分类模型可能存在不稳定等情况,提出一种异质的集成学习方法。首先对朴素贝叶斯(NB)、支持向量机(SVM)、随机森林(RF)三种基分类器分别进行提升和改进,然后采用分裂粒子群优化算法(DPSO)来寻找各个基分类器的最优权重,最后根据得到的一组最优权重向量进行投票。实验表明,采用DPSO作为分类器权重寻优的方法比使用简单的分类投票算法分类精确率、召回率、F值都有所提高。由此可见,提出的方
【机 构】
:
上海师范大学信息与机电工程学院,武汉理工大学计算机科学与技术学院
论文部分内容阅读
针对单一的情感分类模型可能存在不稳定等情况,提出一种异质的集成学习方法。首先对朴素贝叶斯(NB)、支持向量机(SVM)、随机森林(RF)三种基分类器分别进行提升和改进,然后采用分裂粒子群优化算法(DPSO)来寻找各个基分类器的最优权重,最后根据得到的一组最优权重向量进行投票。实验表明,采用DPSO作为分类器权重寻优的方法比使用简单的分类投票算法分类精确率、召回率、F值都有所提高。由此可见,提出的方法可以有效地提高文本情感分析的准确率。
其他文献
运用信息论的理论基础,给出了一个结构歧义的信息熵模型,用此模型分析了利用上下文信息对歧义结构进行消解的数学原理,建立了度量歧义结构歧义强度的定量方法和消歧策略的收益率模型。在基于规则的上下文排歧中,引进了基于统计的信息熵和互信息方法,把基于规则的理性主义方法与基于统计的经验主义方法巧妙地结合起来,分析了基于信息论的汉语结构歧义自动消解的最优策略法和上下文信息最优策略法中所依据的语言学知识及数学原理
针对传统凝聚式层次化数据发现算法效率不高、生成的层次谱图复杂、主要解决静态数据而较少针对动态数据的问题,提出一种融合拓扑势的自适应层次聚类算法(adaptive hierarchical clustering algorithm incorporating topological potentials,AHCITP)。该算法首先融合拓扑势场理论构建出揭示节点自适应层次关系的峰谷结构;然后结合改进的
利用室内试验测定了土工格栅加筋碎石土的无侧限抗压强度和土工格栅加筋粉砂土的回弹模量,分析了加筋层数和压实度对加筋土的抗压特性和变形特性的影响规律。试验结果表明:当
针对大数据背景下K-means存在选取质心导致的局部最优解、聚类速度慢的问题,提出一种Flink平台下的CK-means聚类优化及并行策略。从算法优化层面,采用Canopy算法确定聚类数目k并选取初始质心;从并行化加速层面,基于Flink平台设计了一种面向CK-means的并行加速策略,并分析不同并行度对计算耗时的影响。经实验,相较于K-means算法,CK-means算法的准确率与迭代次数间的比
随着人们环境保护意识的不断增强,植被护坡技术越来越受到重视,在高等级公路建设中被广泛应用.通过对我国高等级公路边坡植被防护技术进行分析,指出对于不同方法以及不同地区
随着信息技术的发展,包含文本信息的数据正在爆炸式增长,如何从中获取有用信息具有重要研究价值。由此,文本表示学习成为了自然语言处理领域的一个热点问题。现如今广泛存在的文本数据不仅包含其本身的文字内容,而且还具有文本之间的结构关系,如论文引用、微博转发等关系。但现有方法通常仅考虑文本内容,忽略了文本间的结构关系。针对该问题,提出一种面向文本的结构—内容联合表示学习模型(SCJL)。该模型可以同时建模文
针对我国深层石油开发勘探技术进行相关探讨,以期为相关工作者提供帮助。
蝴蝶优化算法作为新提出的自然启发算法,其寻优方式模拟了蝴蝶利用嗅觉来确定花蜜或交配对象位置的行为。针对蝴蝶优化算法求解精度不高和收敛速度慢等问题,提出一种基于自适应扰动的疯狂蝴蝶算法(CIBOA)。首先,在自身认知飞行部分引入自适应惯性权重,平衡算法的局部与全局搜索能力;其次,在全局最优位置引入扰动策略,避免算法陷入局部最优;最后,在花蜜位置引入疯狂因子以增加种群多样性,获取更好的最优解。通过八个
在修建矿井、长隧道以及地下铁道等井筒工程中,井简装备中的锚杆得到了充分的应用,其技术定位也越来越专业化、系统化。详细阐述了锚杆的种类以及在井筒装备中锚杆技术的定位等
交织区是快速路主线通行的交通瓶颈和事故多发地。合理的交织区长度对提高交织区服务水平和通行能力具有重要意义。鉴于此,分析了交织区运行的各个影响因素,提出了基于密度指标