基于类别核心词的朴素贝叶斯中文文本分类

来源 :山东大学学报:理学版 | 被引量 : 0次 | 上传用户:qianxiaoping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用.在此基础上提出了基于类别核心词的分类模式,从标题、摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用.基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率.
其他文献
利用卫星双向时间频率传递方法可以实现精度优于1 ns的远程时间同步。卫星双向设备时延差是影响双向比对结果的一项主要误差。目前,国际上通用的方法是利用一套可移动的双向
为了提高木材的使用效率、避免由于木材缺陷造成生产故障,根据木材缺陷类型对其分类处理是一种有效的手段,但木材缺陷复杂多样且具有诸多相似性使得类别区分成为难点。针对以上问题本文提出了一种基于子区域变尺度高斯拟合模型的缺陷识别方法。首先建立变尺度高斯拟合基本模型,然后将缺陷纹理分成若干子区域,提取各分区的高斯拟合特征并进行融合;将高斯融合特征及圆度和边缘直线度这两个几何特征输入到建立好的BP神经网络模型
针对视觉测速系统误差较大且灵活性差的特点,提出了基于视觉几何的传送带上物体速度检测的方法,该方法无需摄像机标定。通过离线和在线图像处理相关算法提取图像参考点和工件
东京设计师周2007(Tokyo Designer’s Week 2007)是日本。乃至亚洲设计界最大、最具影响力的活动。该活动于每年10月份举行。今年的举办时间是10月31日到11月4日.为期5天。本年
用分子动力学模拟方法研究了小蛋白天然结构集合与其折叠速度的关系.根据蛋白质内存在接触的不同定义方式,利用分子动力学模拟方法得到了10个小蛋白的一系列构象集合,分析了