【摘 要】
:
通过对情感文本与n-gram特征的研究与分析,提出了一种基于卡方统计的特征词提取方法.方法中,n-gram特征作为文本特征,在传统卡方统计的基础上选取共现或单独出现的特征,因为共现与
【基金项目】
:
国家自然科学基金项目(61202227)
论文部分内容阅读
通过对情感文本与n-gram特征的研究与分析,提出了一种基于卡方统计的特征词提取方法.方法中,n-gram特征作为文本特征,在传统卡方统计的基础上选取共现或单独出现的特征,因为共现与单独出现的特征在不同类别中可能存在区别性.然后,根据多元特征与类别的相关性判别去除n-gram中冗余的特征,从而选取高类别相关而低冗余的n-gram特征.对上述方法利用SVM算法在不同语料中进行测试,通过实验对比分析,验证了该方法的有效性.
其他文献
背景与目的卵巢癌发病率位居女性生殖器官恶性肿瘤第三位,但其病死率却位居各类妇科肿瘤的首位,据统计,70%的患者直到晚期才被诊断,对广大妇女的生命健康造成了严重威胁。原
高校思想政治教育是一项系统工程,需要协同发力,同向同行。目前,在一些高校存在着协同育人机制顶层设计不到位、资源整合度不高、保障机制不完善等突出问题。遵循协同育人整
竹笛是民族乐器中最常用的管乐器。竹笛的音域由于制作工艺的改善而在逐步增宽。建国以前曲笛的音域只有二组另一大二度,六十年代才增至二组半,实际上竹笛的音域仍有继续增
《加利福尼亚人的故事》是美国著名作家马克·吐温所著的一部短篇小说。本文以《加利福尼亚人的故事》的两译本对比评析为切入点,具体探讨译者主体性的表现及作用。
“The S
关于该用何种句式对日语俳句进行汉译,翻译界一直众说纷纭。围绕这一问题,译界争论的焦点主要集中于其翻译句式——汉译时到底该取义还是存形。根据对俳句翻译中形与义的矛盾
目的:探讨高龄孕妇临产前焦虑、抑郁状况及相关因素。方法:纳入高龄孕妇450例,采用抑郁自评量表(SDS)评定抑郁症状,焦虑自评量表(SAS)评定焦虑状况,社会支持评定量表(SSRS)检
伴随着IT技术与Web技术的发展,信息化成为了行业发展的必然趋势。在建筑行业领域,建筑信息模型(BIM)的提出,成为了建筑业信息化发展的主流趋势。然而,作为BIM技术发展的重要
目的:1.观察fascin、Tiam1、nm23蛋白在胃癌组织中的表达变化。2.探讨fascin、Tiam1、nm23蛋白的表达与胃癌临床病理参数的关系。3.明确fascin、Tiam1、nm23蛋白在胃癌侵袭,转