科技项目检测系统的构建及算法研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:plghqr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技项目检测属于文档复制检测技术的一种应用类型,它规范了科技项目奖励的制度,是检测同一项目是否重复报奖的一项重要措施。科技项目奖励机制旨在对已有的科技成果给予奖励,肯定广大科技工作者的科技成果,并激发与鼓励科技工作者更大的科研热情,为社会与国家的建设做出更大的贡献。由于奖励有一定的份额,为了公平、公正地奖励申报的科技项目,需要对申报的科技项目进行检测从而防止项目的重复申请。本文首先提出了最长回溯分词算法来进行中文句子的分词,从而提高分词的准确性;其次,根据科技项目申报书的结构特点,本文设计了科技项目检测系统的体系结构以及相应检测算法。本文按照不同的组成部分,采用不同的相似度检测算法计算其对应的相似度。例如,按照本文提出的基于N-gram的VSM模型的思想,构建正文检测相似度算法,对正文中相同词频不同词序进行相似度判断。本文还详细介绍了科技项目检测系统的各功能模块的构建与实现,这些模块包括预处理模块、内容解析模块、相似度计算模块、结果显示模块。此外系统提供了检测选项,工作人员可以选定每次需要进行检测的项目组成部分。最后,在上述的基础上进行了大量的实验,实验证明,该系统具有较强的实用性,有助于提高工作的效率,同时总结了作者所作的主要工作及本文的创新之处。
其他文献
服务计算是跨越计算机与信息技术、商业管理、商业服务等领域的新学科,是应用面向服务的体系架构(SOA)技术消除商业服务与信息支撑技术鸿沟的直接产物。按SOA原则而构造实现的
网格任务调度是网格计算的重要组成部分,直接影响着网格计算系统的性能。然而,由于网格环境自身具有异构性、分布性、开放性、不确定性以及动态性等特点,这就对传统的任务调度策
大数据的几个特性中,关于数据多样性的研究较少。度量空间数据管理分析方法把数据抽象成度量空间中的点,具有高度的通用性,是应对大数据多样性挑战的有效手段之一。由于度量
随着信息技术的高速发展,面向服务的架构(SOA)的出现极大地提高了软件开发的效率,但同时由于Web数据与资源共享程度的不断提高,资源的安全问题却变得越来越严重,如何支持分布式环
随着数据中心应用提出的需求不断变高,数据中心网络作为数据中心的重要组件,其负载也变的越来越大。这样导致拥塞情况频繁的发生,容易形成一种被称为incast的吞吐量大幅下降的现
多点监测无线传感网络中,由于节点能量有限和数目众多的特点导致网络的寿命受到限制。网络中数据包的无线收发消耗了节点的大部分能量,在无线传感网络内部的传感数据汇集过程
本文根据WSN网络自身的特征,给出了路由协议所需要的设计原则,详细分析了多路径路由协议,基于这些多路径路由协议的特点,开展了针对SMR协议的进一步研究。同时针对基本的蚁群
全球变暖与人类活动产生的温室气体和气溶胶有直接联系,而人类对温室气体的认知水平高于气溶胶。大气气溶胶不仅通过吸收和散射太阳辐射直接影响大气系统的热量平衡,而且作为云
互联网的飞速发展使得人类的信息总量呈现出指数级增长的趋势,为了使用户能够更快更准确地在海量的资源中找到与当前需求相关的信息,信息检索技术应运而生。目前,搜索引擎作为信
人脸识别技术是计算机视觉领域中的一个重要研究方向,被广泛应用于安防监控、金融系统、电子商务等场景。深度卷积神经网络的发展和海量数据的涌现,使得人脸识别的技术可以达到非常好的效果。不过与此同时,网络结构的复杂度越来越高,规模也随着增大。另外,与理论研究的场景不同,在实际应用中,基于这些网络结构的人脸识别技术将会遇到非常多的挑战,如系统容量、算法准确率、开发简易性等等。现有的深度卷积神经网络模型通常对
学位