【摘 要】
:
信息的重要程度越来越高,各行各业都被海量的信息所覆盖,这海量的信息中包含着多种模式的信息载体,形如文本、视频、图片、语音等,其中文本则是这些信息的最重要的载体之一。然而在船舶领域,还没有形成一套合理的分类流程与方法,在区分专业性极强的船舶文本信息时需要进行人工比对,这将花费大量的人力资源成本和时间成本。本文就此问题提出一套可行的解决方案,并在原算法基础上进行创新。本文主要研究将文本分类相关技术应用
论文部分内容阅读
信息的重要程度越来越高,各行各业都被海量的信息所覆盖,这海量的信息中包含着多种模式的信息载体,形如文本、视频、图片、语音等,其中文本则是这些信息的最重要的载体之一。然而在船舶领域,还没有形成一套合理的分类流程与方法,在区分专业性极强的船舶文本信息时需要进行人工比对,这将花费大量的人力资源成本和时间成本。本文就此问题提出一套可行的解决方案,并在原算法基础上进行创新。本文主要研究将文本分类相关技术应用于船舶领域,使得能节省大量人工比对消耗的时间与成本,对常用文本分类算法进行分析比较,在实际应用于船舶领域中的特征提取实验法有针对性地针对不足之处进行改进,使得工况点在权重计算的时候更加合理。分析快速文本分类算法fasttext算法,结合应用船舶领域,针对船舶设备、区域的差异性导致关键词权重及计算不准确的影响,对fasttext模型进行定向改造。提出C-fasttext新的算法模型。并通过前后端分离技术实现分类结果展示,符合产品需求。本文的任务目标为在保证不同命名规则的语料库到来时自动分类成功的准确率与召回率能够同时大于90%,控制误报率不超过5%,语料库覆盖率超过95%。将提出的C-fasttext模型和传统的支持向量机算法、朴素贝叶斯算法、原始fasttext算法进行对比,分析对比结果,实验表明,改进的C-fasttext算法比传统的fasttext算法有4%的分类效果提升,对比朴素贝叶斯算法有15.3%的分类效果提升,对比支持向量机算法拥有31.5%的分类效果提升。
其他文献
我国矿井瓦斯地质条件复杂多样,因而不同矿区的瓦斯赋存千差万别,陕西韩城矿区北部为煤与瓦斯事故突出重灾区,特别在瓦斯富集的煤层软分层区域容易发生瓦斯事故,而矿区南部象山矿虽未发生煤与瓦斯突出事故,但其生产遭受着矿井瓦斯的严重制约。准确掌握象山矿的瓦斯解吸特性及瓦斯赋存规律,是矿井针对性瓦斯治理的重要指导,是保障矿井安全并高效生产的关键性问题。本文采集了象山矿3#、5#煤层软硬分层煤样,通过实验室实验
为了准确识别用户意图并帮助用户快速找到目标信息,需要在尽可能完整地表达目标信息全部涵义的前提下使用有限个数的标签对短文本进行分类。中文短文本通常表现出长度短、表述不规范和内容多样等特点,使用传统的文本单标签分类算法无法对其进行有效分类,因此针对中文短文本的多标签分类算法一直是学者们的重点研究方向。本文在现有文本多标签方法的基础之上,针对文本表示方法和特征提取策略进行改进,提出一种基于多维度特征融合
为了探究旱地苹果园长效实用的水肥保持方法,在延安市黄土塬上的果园中探究不同保水处理对土壤含水量、土壤养分含量、树体生长发育及果实品质的影响。结果表明:埋砖和施用保水剂均能减缓深层土壤含水量的下降趋势;埋砖叠加保水剂处理可提高土壤N、P和K养分含量,单一保水处理可提高土壤P、K的养分含量;各处理均能提高叶片SPAD值和叶片含水量;各处理均可增加苹果单果重和单株产量;保水剂处理和埋砖叠加保水剂处理更能
文章在全面总结剖析国内外种业创新发展现状与趋势的基础上,对山东省种业创新发展情况进行了系统梳理,针对山东省当前种业创新发展存在的主要问题与迫切需求,提出了种业创新的主要目标、技术路线和相关对策建议,以期为山东省乃至全国各省市种业创新发展提供积极借鉴。
煤层瓦斯含量的准确测定对矿井瓦斯的防治具有重要意义,而直接法测定煤层瓦斯含量测定过程中损失瓦斯量得精准计算至关重要,目前损失瓦斯量补偿计算模型较多,且各煤层瓦斯解吸规律也各不相同,导致各损失瓦斯量补偿计算模型在使用时计算结果产生的误差较大,造成瓦斯含量测定值偏差较大。为此,为提高平煤六矿煤层瓦斯含量测定的准确性,在戊8、戊9-10、丁5-6煤层现场采取代表煤样,进行0.5MPa、1.0MPa、1.
随着我国煤炭开采的深度和规模不断增加,煤矿灾害发生的频率也随之增高,造成的危害也更大。煤矿生产安全事关国家能源供应的稳定和工人的人生安全,所以对矿井各种灾害预测方法的研究具有重大的意义。人们对各类预测煤矿灾害的方法展开了深入的研究与分析,其中电阻率法也被用来预测煤矿灾害的发生。电阻率法能够通过利用地壳内各种岩石之间导电性的不同,凭借探寻和揭露地下人工建立的稳定电流场的分布规律,来探测断层破碎带、调
人脸超分辨率是计算机视觉的一个热点研究方向,目前多数算法仅针对双三次降采样或其他高斯模糊技术生成的人工低分辨率图片进行超分。但真实场景下采集到的人脸图像往往受到噪声、模糊、低分辨率等复杂降质因素的干扰,这导致传统的人脸超分具有较低的鲁棒性,无法满足现实需要。因此对真实场景下的人脸图片进行盲超分具有重要的现实意义。针对这一问题,常见的人脸盲超分算法分为有监督和无监督两种技术方向。其中基于有监督的算法
在问答场景中,回答问题需要依赖大量的背景知识,基于规则和文本匹配方式的自然语言问答无法利用现有的大量人类背景知识。传统的基于知识图谱的检索式问答采用流水线的方式实现,这会导致错误传播。为了减少累积错误,一般会采用多召回后排序的方式。但是,这种方式会导致召回的候选路径过多,增加了路径排序的难度。为了解决以上问题,本文提出了一种将生成路径模型与信息检索相结合的方法。其中本文的主要工作如下:(1)构建了
硅基液晶芯片(LCOS)是实时光学信息处理,自适应光学和光计算等现代光学领域的关键器件,它在现代光学技术的发展中起着重要的作用。由于LCOS支持Flex-grid特性,已成为实现WSS模块的主流技术方案。基于LCOS芯片的空间光调制器的工作原理是利用液晶的电控双折射效应,它是一种在不改变光束振幅的条件下,实时、动态地对入射光进行相位调制的一-种光调制器件,被广泛应用在光电混合信息处理系统中。与传统
根据海关统计数据,按国别或地区对近年来山东苹果的出口情况进行了分类汇总。结果显示,2017—2021年,山东苹果共出口到世界57个国家或地区;其中,对海上丝绸之路沿线各国或地区的出口量占总出口量的98.66%,且单价高于对外出口均价。鉴于我国苹果出口受新冠肺炎疫情、地缘政治和国际形势等多种复杂因素影响,建议山东省充分利用RCEP提供的历史机遇,继续深耕东南亚市场;发挥海运优势,努力扩大在中亚和西亚