一种基于特征投票的文本分类方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:jigmei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于特征投票机制设计一种线性文本分类方法,运用信任机制理论分析文档类别对特征的信任关系,给出具体特征信任度的模型,并在Newsgroup、复旦中文分类语料、Reuters-21578 3个广泛使用且具有不同特性的语料集上与传统方法进行比较。实验结果表明,该方法分类性能优于传统方法且稳定、高效,适用于大规模文本分类任务。
其他文献
针对当前流行覆盖网组播模拟器无法准确为组播系统建模及评测性能的问题,提出一种节点群支持整体代换和多树结构的自相似结构化覆盖网组播(S3M)模型的,设计一个结构化覆盖网组播
多层网络的同步性问题是近年来学者们研究的热门课题,由于在现实中,大多数网络都不是单层网络,而是有相互联系的,比如铁路网与互联网之间的联系、生活中的人际关系网与微信虚拟朋友圈网络之间的联系等等。因此,为了更为真实地描述现实中的网络,有必要对多层网络进行深入而透彻的分析研究。本文探讨了多层网络中的层内同步问题,论文以两层网络为例建立网络模型,继而做深入的研究。网络由x层与y层构成,其中x层与y层分别具
无纺布育苗是水稻育苗史上的突破,它克服了以往育苗通风繁琐、炼苗困难、秧苗素质差的弱点,实现了一次性作业不用通风,达到苗匀、苗齐、苗壮的目的。笔者通过本文对水稻无纺
文章叙述了通过萘酚氧化缩聚反应,合成羟基亚萘基齐聚酯(OΓH)的工艺.与此同时,用可溶解可熔融的OΓH替代导电炭黑,并把它添加到丁腈橡胶CΚH-40胶料中,制成具有较高力学性能、
文中的主题是关于导电橡胶体积电阻率形成的综合因素的分析与研究.结果表明,可以将炭黑聚集体之间接触点数量的比值用于对导电性能的预测和分析.对橡胶导电性能作用最大的因