【摘 要】
:
针对标题文本特征少、特征维度高和分布不均匀导致分类性能不佳的问题,提出了一种利用分类体系结构信息的双向特征选择算法,并在该算法的基础上实现标题分类。该方法以具有严
【基金项目】
:
省部级实验室/开放基金资助项目(B2014)
论文部分内容阅读
针对标题文本特征少、特征维度高和分布不均匀导致分类性能不佳的问题,提出了一种利用分类体系结构信息的双向特征选择算法,并在该算法的基础上实现标题分类。该方法以具有严格层级关系的分类体系为应用前提,利用类别与词的同现及分布关系进行特征词和候选类别的双向选择,构建类别向量空间;通过分析标题文本特征词在层级类别向量空间的分布所表现出的类别语义信息,确定文本所在层级以及所在层级的候选类别;之后利用分类器对未能成功分类的标题进行分类。在人工标引数据集上的实验结果表明,该方法在不进行语料扩展和外部知识库添加的基础上仍可
其他文献
针对绝大多数汇聚节点选址策略都是基于静态传感器网络的问题,提出一种分布式和集中式的SCSN模型。该模型实现了结构意识自适应算法,能在移动传感网中动态实时地维护汇聚节点
预测是适应社会经济的发展和需要而产生的对未来发展趋势进行分析的一种手段,灰色预测模型是预测理论在应用中被广泛使用的一种预测方法,与其他预测方法一样灰色预测模型存在着
针对片上网络的非均匀业务流,提出一种基于模拟退火遗传算法的缓冲区资源分配算法,对系统的有限缓冲区资源的分配问题进行了研究。该算法建立在二维Mesh结构的片上网络通信模
智能环境中普适计算为通过多个交互设备向用户提供信息服务奠定了基础,但如何选择恰当的设备向用户提供服务仍是一项亟待解决的问题。基于用户视觉交互能力参数筛选出最优的
随着视频车牌采集系统的发展与完善,快速路行程时间的动态预测成为了可能。为了提高基于车牌识别数据的快速路行程时间预测精度及有效性,根据快速路车牌识别数据的特征和所能提
材料腐蚀带来巨大的损失。对于大部分地区来说,大气腐蚀等级是未知的。如何准确地补偿缺失的大气腐蚀等级数据成为函待解决的问题。分别针对大气腐蚀等级的两个关键因素氯离子
为了解决当前云计算的实体信任评估领域所实施的方法策略无法满足云计算环境的动态模糊性的问题,设计了一种多属性信任关系的动态评估模型。该方法以遗传自适应学习算法为理