【摘 要】
:
有监督的分类方法是文本分类中常用的方法,它需要采用人工标识的样本进行训练,对样本的人工标识是一个比较繁锁的过程.无监督的分类方法没有这一过程,但其分类的效果往往不太
论文部分内容阅读
有监督的分类方法是文本分类中常用的方法,它需要采用人工标识的样本进行训练,对样本的人工标识是一个比较繁锁的过程.无监督的分类方法没有这一过程,但其分类的效果往往不太好.针对两者各自的优缺点,利用一种基于SVM和K-means相结合的文本分类方法,首先用K-means方法进行文本聚类,然后选取每类中距离聚类中心较近的一些文本作为该类的训练样本训练SVM分类器,最后用训练好的SVM对文本进行分类.此方法避免了无监督方法分类效果不好的缺点,同时也省去了SVM方法中对样本进行人工标识的繁锁过程.基于灾害文本的实验结果也表明了这种新方法的可行性.
其他文献
从饮茶品茗、煎药喝水,到泡澡泡脚、热敷桑拿,生活中随处可见热水的身影.它是国人生活习惯的一部分,更是中国养生文化的一大法宝.rn国人的热水情缘rn喝热水在中国已有几千年
据美国《航空周刊与空间技术》1月 2 4日报道 ,美海军正在发起一项新的多用途无人机计划 ,旨在向海军提供比目前为短程任务研制的垂直 (TOVL)系统更远的航程和更大的能力。与只有
随着时代的发展和社会的进步,信息化建设成了我国重点发展的一部分。同样党校信息化建设也是党校发展中非常重要的一方面,因为信息化建设是改善党校教育方式和提高教学水平的关键部分。尽管如此,我们依然不能盲目发展,而忽视党校信息化建设中存在的安全问题,这也关系到党校能否持续健康发展,下面本文就党校信息化建设安全问题进行研究分析,提出相关建议,希望对我国党校信息化建设有所帮助。
流控制传输协议(SCTP)是IETF推荐的一种新的传输层协议,它继承了传统TCP的一些特性,并发展出独特的多流性和多宿性,能更好地适应现代通信网发展的需求,并在一定程度上有取代
本文采用文献资料法、逻辑分析法,就襄阳国际马拉松对襄阳市城市发展的影响进行调查研究.研究结果表明,襄阳国际马拉松已经成为襄阳市的一张名片,扩大了襄阳市的知名度,影响
为了科学地评测某种数码输入法的性能,首先必须获得该输入法的字码本.文中提出了通过技术分析自动获取字码本的两种方法:一种方法是使用文件监测程序Filemon和十六进制文件查
不孕不育,不仅对于女性来说是痛苦不堪的,也在很大程度上影响着家庭幸福.不少女性的不孕不育其实属于功能性不孕症,如果能够放下心理负担,理性选择适合的治疗方式,合适的医生
上海和为科技有限公司成功实施的安徽省蜀山监狱人员实时定位跟踪系统(基于无线射频RFID技术实现的人员实时定位跟踪系统)项目是司法部首个成功实施的监狱人员实时定位试点项