航行通告中自然语言理解算法研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:haose1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航行通告机器识别,对于规范化的代码处理相对简单,但对于自然语言处理起来相对困难.针对航行通告中类别多,数据分布不平衡,中英文混合等问题,提出基于word2vec文本向量化技术的文本分类方法,针对小样本数据采用smote算法对数据重采样,经过重采样后的数据选择使用XGBoost继承算法模型完成分类.由中航材导航技术公司提供的航行通告标签原始数据,经实验表明,能够有效规避样本数据分布极不平衡,分类数量过多的问题,同时模型的主要评价指标都有提高,包括模型的准确率、召回率及F1值.
其他文献
摘要:《无线网络安全技术》课程是天津城建大学网络工程专业网络安全方向本科生的一门专业必修课,其实验教学尤其是无线局域网安全实验,存在课时少、管理复杂、软硬件资源受限等问题,使用Linux Apache MySQL PHP架构的WEB应用程序,实现学生对Aircrack-ng套件以及实验用硬件资源的访问、作业提交等功能,同时实现老师对作业的检查和对实验资源的便捷管理。该实验教学平台合理配置软硬件资源
该文针对传统新闻发布系统存在的问题,设计并实现了基于Web的新闻发布系统.根据动态网页技术的工作原理,该新闻发布系统的开发以VisualStudio作为平台,使用VB.NET网络程序设
摘要:在科学技术快速发展的同时,电子信息工程在诸多领域中的价值得到充分认可。而在电子信息技术的作用下,企业的管理水平与生产效率也随之提升,但是在具体应用中,受到各方面因素的影响,电子信息工程技术的应用还存在一些问题,使得自身的优势无法得到充分的发挥。因此,在现阶段的电子信息工程技术应用中,需要针对目前存在的问题,采取有效的解决措施,更好地推动社会经济的发展,同时为人们的工作与生活带来更大的便利。 
近几十年,计算机技术和网络技术的迅速发展和普及使各行各业发生了翻天覆地的变化,许多行业已基本实现了数字化、信息化.这给人们带来巨大便利的同时,也隐藏着各种各样的安全
随着个人计算机系统性能的显著提升以及X86架构的服务器系统的广泛使用,实验室的服务器设备面临计算机资源闲置的问题,如何充分挖掘利用现有设备的潜力,在不新增硬件的前提下
1 文献来源rnChabon JJ, Hamilton EG, Kurtz DM, et al. Integrating genomic features for non?invasive early lung cancer detection[J]. Nature,2020,580(7802):245-251
通过App进行线上语言学习已经成为当下语言学习的趋势.而目前的许多语言学习App都在其教学过程中融入了游戏化的设计.本文希望探究不同的语言教学App中的游戏化学习体验的表