基于边界可信度相似的快速文本分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：niitliu

【摘要】

：

类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,

【作者】

：

杨林波王士同

【机构】

：

江南大学信息工程学院,江南大学创新多媒体中心

【出处】

：

计算机工程与应用

【发表日期】

：

2009年4期

【关键词】

：

文本分类相似度快速分类 text categorization similarity fast categorization

【基金项目】

：

国家教育部科学技术重点研究项目（the Key Technologies Project of the Ministry of Education of China No.105087 ）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高了分类性能。实验结果表明该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。

其他文献

可控制形状的多边形变形算法

提出了一种可控制形状的多边形变形算法。该方法在源和目标多边形上指定对应的特征点,通过特征点的位置变化来带动整个多边形变化。得到的中间多边形在特征点约束下保持原内在量相对关系的最小变化,有效去除了多余的形变。通过试验表明,该算法产生的变形序列能很好地避免萎缩、自交等不自然现象,取得了良好的变形效果。

期刊

变形多边形形状控制morphing polygons hape controlling

单次散射非视距紫外光通信非共面模型的验证

为了验证椭球坐标及球坐标下的单次散射非共面模型的正确性,本文首先采取当发射偏轴角及接收偏轴角为零时这两种模型应该退化为共面模型而与单次散射共面模型进行对比。其次,

期刊

非视距紫外光通信单次散射非共面模型

车辙试验确定沥青用量的可行性研究

通过车辙试验,分析不同沥青用量下的车辙指标。在不同沥青用量的试验均符合动稳定度要求的条件下,追究其车辙深度,得出最佳沥青用量,并用马歇尔试验来检验沥青用量是否符合标

期刊

沥青混合料室内车辙试验沥青用量

过度包装对环境的危害

解释了过度包装的概念,分析了过度包装的成本及其危害,提出了治理过度包装的对策及建议。

期刊

商品过度包装环境影响对策

基于阅读的高校图书馆人文素质教育探究

基于对当下大学生阅读状况的分析，指出当前大学生人文素质教育的必要性及现状，指出高校图书馆人文素质教育的优势，并提出高校图书馆应对人文素质教育的策略。

期刊

高校图书馆人文素质人文素质教育

一种空时分组码最大似然检测的迭代算法

为了探讨某一类型空时码的最大似然检测的迭代算法.给出了这类码基于冗余线性预编码的通用构架,包括许多空时码算法示例.用这些码的特殊线性结构导了出在估计参数和检测发送

期刊

空时分组码最大似然检测迭代算法空时码无线通信链路Codes (symbols)Computer simulationDecodingIterat

TA-chord2：基于分层DHT的拓扑感知流媒体体系

针对目前DHT系统较高的维护开销、应用层网络与物理网络的拓扑失配等不足，提出一种基于分层DHT的拓扑感知流媒体体系TA-chord2。分层的设计使节点根据其服务能力对系统做出相

期刊

TA-chord2chord邻近邻居选择(PNS)VIVALDI拓扑感知TA-chord2 chord Proximity Neighbor S

基于边界可信度相似的快速文本分类方法

其他学术论文