论文部分内容阅读
随着信息化技术的不断发展,网络信息量呈指数级增长,而浏览网络资源也成为获取信息的一个重要手段。在杂乱无章的各类网络资料中,如何快速而准确地帮助用户定位到所希望浏览的内容成为一个重要的研究课题,为了有效管理网络资源,方便用户查阅,文本分类技术应运而生。支持向量机(SVM)算法被认为是文本分类中效果较为优秀的一种方法,它是一种建立在统计学习理论基础上的机器学习方法。该算法基于结构风险最小化原理,将数据集合压缩到支持向量集合,学习得到分类决策函数。本系统平台结合用户分类需求,通过调用ICTCLAS50分词工具包与libsvm分类模型实现对网络新闻的分词、计算词频,提取关键词、特征表示和分类操作,同时提供了用户管理和新闻管理功能,在保证文本分类核心功能的同时使用户可以管理自己的新闻文档。本文介绍了课题研究意义、国内外研究状况、关键技术、开发平台、系统模块与数据库设计、各个功能模块的实现,同时添加了用例图,E‐R图,程序流程图等对系统开发进行了解释说明,在系统实现里给出了一些系统界面和相关功能的操作方法。测试阶段利用黑盒测试等软件方法对平台系统进行测试,系统能够稳定运行,同时利用大量文本数据对系统分类结果进行测试,保证新闻分类系统的精确率。