【摘 要】
:
微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响。为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法。定义一种基于规则的识别方法过
【机 构】
:
广西师范大学广西多源信息挖掘与安全重点实验室,广西区域多源信息集成与智能处理协同创新中心
【基金项目】
:
国家自然科学基金(61663004,61363035,61365009);广西自然科学基金(2016GXNSFAA380146,2017GXNSFAA198365);广西多源信息挖掘与安全重点实验室主任基金(16-A-03-02);广西学位与研究生教育改革专项课题(JGY2015031)
论文部分内容阅读
微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响。为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法。定义一种基于规则的识别方法过滤出显式垃圾评论,剩余的评论归为相关评论,构建AdaBoost分类器和支持向量机分类器,通过Co-Training算法进行协同训练,判断其是否为垃圾评论,以提高分类精度,节省样本标注工作。实验结果表明,与基于相似度计算的垃圾评论识别方法、基于评论多特征的垃圾评论识别方法相比,该方法具有较好的识别效果。
其他文献
在当前新兴媒体的发展浪潮下,广播电视等传统媒体受到了一定的冲击,自媒体的迅速发展让传统媒体尤其是基层媒体面临着更加严峻的形势,在这种情况下,进一步提高新闻节目的质量
金沙河为辉发河左岸一级主要支流。位于吉林市境南,是境内五大江河之一,掌握该站洪水特性,对防汛抗旱和水资源科学合理开发利用有着十分重要的意义和作用。文章根据该站实测
针对西部高校开设城市地下空间工程专业的现状,分析了城市地下空间工程专业的发展前景,指出了国内目前城市地下空间工程专业分布存在分布不均衡、培养定位不明确、培养质量参
目的:探讨重度烧伤患者植皮术后最好的治疗卧具。方法:将48例重度烧伤后行植皮术的患者按知情自愿的原则分为观察组和对照组,观察组22例,植皮术复苏后置于悬浮床;对照组26例,植
结合我国当前的实际需要,研究数字水准仪原始记录数据的预处理。该预处理软件采用C++进行程序代码的编写,对水准测量的各种情况进行逻辑分析,利用原始观测文件的多种信息,形成正确
在自主研制开发CFRP体外预应力筋夹片式锚具的基础上,进行了六片体外CFRP预应力筋混凝土粱斜截面抗剪性能试验,其中三片CFRP体外预应力筋为直线布置,另外三片CFRP体外预应力
目的本研究探讨盐酸右旋美托咪啶(Dex)是否通过提高HIF-1α的表达减轻糖尿病大鼠肾缺血再灌注后损伤。方法高脂高糖饮食8周后的SD大鼠,30 mg/kg链脲佐菌素(STZ)腹腔注射,建立
《基础教育课程改革纲要(试行)》中明确提出:“大力推进信息技术在教学过程中的应用”;“促进信息技术与学科课程的整合。逐步实现教学内容的呈现方式、学生的学习方式、教师的教
沥青搅拌设备振动筛的加工对象为热集料,为了解决目前对沥青搅拌设备振动筛的强度分析只考虑由载荷所引起的静应力和动应力,而不考虑温度应力的影响,致使振动筛经常出现故障
<正>定价:58.00元ISBN:978-7-117-21794微创牙体修复不同于传统的以洞型预备为基础的牙体手术修复技术,它强调较大限度地减少对牙体结构的破坏,突出较小限度介入理念,是包含