【摘 要】
:
以中文情绪语料库(Ren-CECps)为基础,重点研究了句子级情绪识别方法.比较了不同特征以及不同机器学习分类方法(NB,SVM,ME)对情绪识别的影响.此外,针对情绪文本和非情绪文本在
【机 构】
:
苏州大学计算机科学与技术学院,香港理工大学中文及双语学系
【基金项目】
:
国家自然科学基金(61003155,60873150);模式识别国家重点实验室开发课题基金资助项目
论文部分内容阅读
以中文情绪语料库(Ren-CECps)为基础,重点研究了句子级情绪识别方法.比较了不同特征以及不同机器学习分类方法(NB,SVM,ME)对情绪识别的影响.此外,针对情绪文本和非情绪文本在语料中的分布非常不平衡问题,通过集成学习的算法来实现不平衡情绪识别,用以提高情绪识别的整体性能.实验结果表明:使用基于样本的集成学习方法能够有效解决不平衡问题,明显提高情绪识别的分类性能.
其他文献
在航空发动机燃烧室的研发过程中,传统的测量手段往往有时无法实施或不能满足精确捕捉流场信息的要求,发展新型、高精度测量以及先进诊断技术势在必行。重点介绍了适用于航空
随着“互联网+”应用领域越来越广泛,互联网给教育领域的发展提供了一种新的生态。如何利用“互联网+”平台,让信息化技术与高职教育进行深度融合,创造新的教学效果,是目前亟
扬弃“积淀”是高尔泰及其所代表的中国现代美学流派区别于其他“主体性美学”或“实践美学”派别的一个重要特征。它从对主体及其个体主体性的肯定至“积淀”的扬弃,经历了一
当前,我国企业单位会计人员遵守职业道德整体情况良好,但还存在不少缺陷,需要进一步完善。本文具体分析了目前我国企业会计职业道德的基本情况,并提出了相应的对策建议,以供
【正】 保守性思维及其主要特点保守性思维是只有继承、没有创造,只有模仿、没有革新的一种思维.它的目标是掌握现成的知识、原理、结论和方法.因此,保守性的思维又可称为继
急性肺损伤/急性呼吸窘迫综合征是一种常见的危重症,是死亡和残疾的主要原因。由于缺乏有效的治疗措施,迄今其病死率仍高达30%-50%。创新治疗是需要的。近年来,随着间充质干细胞
定远县供电公司炉桥中心供电所位于定远县炉桥镇,营业区域面积308.2km^2,辖区内有39个行政村,供电服务总人口16.29万人,管辖10kV线路21条,总长度约为329.41km;低压配电线路总
宦官主要是对在宫廷中为皇帝及其亲属生活服役的官役人员的总称。宦官们通过各自的活动在历史上留下了不同的印迹,明代中后期皇帝荒政,宦官趁机揽权,势力渗透到政治、经济、
<正>髌骨软化症(CP)又称髌骨软骨软化症,是引起膝前痛的常见病因之一,其患病率高达36.2%,女性发病率高于男性。CP是临床常见病、多发病,病因至今尚未十分清楚,在临床也无统一
目前我国农村环境污染形势严峻,农业面源污染、生产生活垃圾废弃物污染、农村工业污染和城市垃圾转移污染等导致农村水质恶化、空气质量变差、土壤肥力降低、农产品品质下降