文本层次分类系统的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:gaolch003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出了层次分类模型,将类别按相似程度形成一棵树形结构,对文章分类时是一层一层逐层比较的,这样就使得文本分类时文本与类别之间的比较次数大为减少,同时由于大的类别的特征之间的区别比较明显,因此又能在一定程度上提高文本分类的精准率.考虑到一篇文章的标题和正文对决定文章所处的类别上所起的作用是不同的,文中将标题和正文分开处理.还有在进行特征选择时将TFIDF和MI结合起来,这也是该文的创新之处.实验结果表明,层次分类的方法在速度上比一般分类快15%左右,而精准率又有一定程度的提高.
其他文献
提出了一种基于径向基函数(RBF)神经网络的修补方法,该方法首先通过人工介入法在残缺数据的边界附近获取样本点集,并以其最小二乘拟合平面为基础建立局部坐标系;其次,在此局部坐标
UML活动图的逆向恢复是逆向工程的重要组成部分,对于理解目标系统的动态行为和控制流程有重要辅助作用.论文针对Windows环境中的面向对象系统,给出了一种基于进程(线程)间关系的UM
南宋姜夔《续书谱》与唐孙过庭《书谱》在内容上有着广泛的联系,表现为:二者内容有许多相应之处,《续书谱》对《书谱》中某些内容作了具体阐述和适当推展;《续书谱》文字有好
通过分析“河南省农村改革发展综合试验区”建设对农业高职高专人才培养、“双师型”队伍建设、专业建设、实训基地建设、校村(企)联动、科技推广体制等方面的需求和推动作用,找