基于朴素贝叶斯的中文海事文本多分类器研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:jianxiangqiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计一个有效地基于朴素贝叶斯的中文海事文本多分类器。在文本分类的预处理步骤中,在中文分词上选取领域词典和停用词典有效地降低特征维数、选取IG特征提取方法、改进的TF-IDF公式中特征词权重的计算方法,以建立词频矩阵等,最后用选取的海事样本数据进行训练建立分类库。实验数据表明,本文的基于朴素贝叶斯的中文海事文本多分类器具有很好的高效性和准确性。
其他文献
为了更好地表现虚拟漫游中的视点效果,研究Vega的运动模式和视点表现原理,通过VegaAPI函数编程。设计一种利用键盘和鼠标协同控制漫游的方法,对系统自带的运动方式进行扩展,提供
对网络的管理和网络故障的诊断一直是企业信息管理中一个重要的研究课题,随着当前网络的飞速发展和网络情况的复杂化,以及网络的不断扩大,企业网络的管理变得非常艰难,定位和
首先介绍太阳集热器热性能测试系统对流量控制的基本要求,然后给出一种闭式循环系统中小流量的控制方法,解决闭式循环系统中流动介质温度大幅度升高时产生汽泡的问题,提出一
为解决数据高效组织和系统管理以及跨域合作数据共享体系不完善的问题,本文设计一个基于Lucene搜索引擎的Web服务影像数据服务器。该服务器核心引入Lucene的全文检索技术进行
高校质量工程的开展和教学资源的紧张,使得南阳理工学院的考务安排工作异常困难,为了提高教学质量和考务管理水平,本文结合学校现状进行需求分析和数据库设计,采用SSH(Struts2
为了在海量数据中把有用的数据提取给用户进行分析,通过对数据可视化和聚类分析的深入研究,将可视化技术与数据挖掘技术两者结合起来,在Java平台下开发一个可视化的数据挖掘
LBS服务是跨行业的系统集成应用,具有十分光明的商业应用前景,但其对应的许多系统都缺乏一个稳定的和可扩展的体系结构。因此,对LBS服务系统选择稳定的体系结构和可扩展的平
程序安全性验证是程序验证的重要部分。基于不变式生成,将程序的安全性验证转化为验证不变式集合是否蕴含表示安全性的逻辑公式。针对简化的C程序,结合验证工具Theorema,在Ma