【摘 要】
:
为加强进出口纺织原料的质量安全管理,山东检验检疫技术中心需要从媒体、论坛、博客、微博等网站里获取进出口纺织原料质量安全信息,并对信息进行统计、剖析、评估和上报。论文针对进出口纺织原料的质量安全管理工作的实际需求,分析、设计并实现“进出口纺织原料自动文摘系统”,主要的研究工作如下:(1)针对现有中文分词算法中歧义切分正确率低的问题,提出了一种新的分词算法—TD-MD算法,该算法将基于统计的互信息与t
论文部分内容阅读
为加强进出口纺织原料的质量安全管理,山东检验检疫技术中心需要从媒体、论坛、博客、微博等网站里获取进出口纺织原料质量安全信息,并对信息进行统计、剖析、评估和上报。论文针对进出口纺织原料的质量安全管理工作的实际需求,分析、设计并实现“进出口纺织原料自动文摘系统”,主要的研究工作如下:(1)针对现有中文分词算法中歧义切分正确率低的问题,提出了一种新的分词算法—TD-MD算法,该算法将基于统计的互信息与t-信息差线性叠加来切分歧义,以提高歧义切分正确率。通过编程对《人民日报》的两大语料库PDA9801和PDA9802进行实验,实验结果表明:TD-MD算法歧义切分的正确率相较于互信息算法、t-信息差算法平均提高了 2.72%、5.95%。(2)针对LDA主题模型提取的文摘质量低这一问题,研究并提出了基于隐马尔科夫主题模型的文摘提取算法—HTMM算法,该算法引用相对熵来计算句子-主题分布与文档-主题分布的相似度以选出候选文摘句,结合文档内容的多个特征对候选文摘句重新排序提取文摘句。通过文摘质量评测工具ROUGE评价器对HTMM算法与LDA文摘提取算法进行比较,结果表明:关键信息覆盖率评测指标方面提高了 0.14166,文摘可读性评测指标方面提高了 0.02619。(3)在算法研究的基础上,采用OO和UML技术,分析、设计并实现了“进出口纺织原料自动文摘系统”。该系统实现了对进出口纺织原料质量安全信息的数据爬取、数据预处理、数据上传、摘要查询、摘要分析评估等功能。本文所研究的TD-MD算法和HTMM算法提高了文摘的质量,对于其它Web文本自动文摘算法的研究与实现具有一定的参考和借鉴价值,研发的系统符合进出口纺织原料的质量安全管理工作的实际需求,提高了质量安全管理工作的效率和质量。
其他文献
本文是关于图中子式的研究,确切地讲,是对著名的Hadwiger猜想及其衍生的Woodall猜想的研究。Hadwiger猜想是说,对于任意k色图,其必定含有完全图K_k作为一个子式。而Woodall则由此推出另一个猜想,对于独立数为α的n阶图,其必定含有一个K n_α的子式。图中的子式是一个古老的图论课题,可追溯到图论中最著名的四色猜想。其中的Hadwiger猜想是近些年来图论中最热门的研究方向之一
Delta算子离散化方法作为连续时间模型和离散时间模型的统一描述方法,已成为连接连续系统和离散系统的纽带。在快速采样条件下,Delta算子描述的离散模型趋近于相应的连续模型,可以有效地避免使用传统移位算子描述系统所带来的数值不稳定问题。执行器饱和现象普遍存在于实际的控制系统中。当执行器的输入量达到一定限制从而进入饱和状态时,进一步增加输入不能对执行器的输出产生任何影响。执行器饱和将使系统的动态性能
三维形体研究已经经历了数十年的发展,并取得了丰硕的成果,为诸如三维游戏、医疗研究、三维打印、虚拟现实研究、分子生物学研究、等诸多领域提供了方便。但是对于复杂的非刚
短波通信使用的频段是3M-30MHz,属于高频频段(High Frequency,HF),短波通信也因此称为HF通信,其利用电离层反射的天波传输可以实现远距离通信。由于短波具有对基建要求低、通
到目前为止,随着多媒体技术的发展,三维信息技术已经在人们日常生活中的诸多领域内取得了广泛的应用,为诸如3D游戏、医疗影像研究与应用、3D打印、虚拟现实技术的研究与应用
我国可转债市场正处于新兴繁荣阶段,越来越多的企业利用可转债进行融资。可转债特殊之处除了“上不封顶,下有保底”的优点外,还可以使得投资者行使转股权,可转债的这些优点吸引了越来越多的投资者。但是由于目前大部分投资者对可转债价值缺乏清晰彻底的认识,不合理的转股行为时有发生。非理性转股会对股价产生不利影响,因此对可转债转股产生的股价影响展开研究对于发行公司价值研究、可转债投资者财富管理以及促进金融市场的稳
伴随着通信技术的发展,广播网络同样在经历着变革与更新。下一代广播网络将具有超高清广播、鲁棒性传输和支持交互性业务的特点。为了更好地满足用户的需求,美国ATSC3.0(Adva
随着经济全球化和信息技术日益向纵深方向发展,软件开发团队面临着愈演愈烈的竞争环境。目前大部分的软件开发团队正面临着开发效率不能完全应对高速发展的需求的困难。频繁的变动需求导致软件开发团队成本增加,同时也造成在软件开发的过程中无法及时、灵活的对需求变动作出回应等问题。软件开发团队获得竞争优势的关键就是如何快速响应变化、提升应对效率。这时,提升软件开发团队敏捷性成为团队顺利完成开发、提升竞争力的核心之
基于2000—2009年工业企业数据库和海关贸易数据库,借鉴De Loecker(2012)的模型对企业加成率及可变生产率进行估计。在此基础上,检验了国际化经营的两种主要方式与企业成本加成率之间的关系,以分析其要素楔子扭曲效应;而后以企业成本加成率的离散度作为衡量资源配置扭曲的指标,并就出口与对外直接投资这两者对资源配置溢价的影响进行检验,以分析其效率楔子扭曲效应。本文进一步分析了异质性企业间影响
随着能源危机和环保形势的日益严峻,寻找可再生能源的新能源汽车成为迫在眉睫的一项任务。混合动力汽车(Hybrid Electric Vehicle,HEV)的多种能量源各自有不同特性,因此对于能量的管理成为混合动力汽车的核心问题。混合动力汽车集合了电气、机械系统,其中还有化学变化和热力学过程参与,很难使用数学模型进行精确地描述。本文针对并联式混合动力汽车能量管理策略存在的问题提出了优化方案,结合模糊