对简单向量距离文本分类算法的改进

来源 :计算机科学 | 被引量 : 0次 | 上传用户:katou1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了简单向量距离文本分类算法的不足,提出了相应的改进算法。把反馈思想引入简单向量距离分类模型,使文本分类系统具备了不断学习的能力。实验证明,改进后的文本分类模型适合于文本分类的需要,改善了原有分类器的性能。
其他文献
Web服务(WS)和SOA(面向服务的架构)正被广泛使用,其最重要的应用之一是用于连接各业务系统以实现企业业务流程自动化。对现有的Web服务的定义及使用的扩展做了一些探讨,将面向对象
针对LEO/MEO卫星网络的特点,提出了快速、自重构且支持多径的空间信息网络路由协议,并进行了仿真和性能分析。该协议不仅大大降低了端到端路由建立的时间,同时多径路由也为实现网
起源于群体智能的微粒群优化技术已经得到广泛的应用。一般情况下,我们假定微粒处于均匀分布的线性空间内。流形是几何学中的概念,概括地说,它是一个非线性空间。提出了一种基于
多宿主是克服路径失效,提高站点服务可靠性的有效途径之一。然而囿于当前TCP/IP体系结构的限制,多宿主还没有得到很好的普及。其中一个重要原因就是IP地址语义过载,IP地址既代表
一般来说,外存访问的数据文件中针对多属性的区域查询有两个改进其效率的方向。一个是在其上建立索引,另一个是在物理层按照某种规律重新安排记录。探讨如何通过第二种方法来提
近年来由于在多方面的广泛应用,无线传感器网络受到了越来越多的关注。然而限于无线传感器网络自身的限制,如何更好地节省能量,仍为无线传感器路由协议设计中面临的主要问题之一
由于多角度多度量的统计方法存在种种问题,提出了通过分形维数从整体上刻画互联网拓扑性质。以传统分形理论为基础,结合互联网拓扑所具有的自相似性质,给出网络拓扑维数的相关概
在现有的UML到Petri网模型转化规则的基础上,引入本体将其作为各种模型到Petri网模型之间转化的桥梁,研究各种模型到Petri网的通用转化方法。为每个模型包括Petri网模型建立本
从大量Web信息中获取有用的信息是web数据挖掘的关键问题。如何评价web信息是否可信,现在主要方法是通过BadRank算法进行内容评测,或是通过链接权重进行相关引用数计算。可信数
针对DeepWeb查询界面集成问题,定义了一种面向专门领域的域序列模式图(FSRG)模型,用于表示和发现同一领域查询界面中的所有域序列模式。该模型将领域内不同查询页面的域序列模式