工程文档语义标注与检索中若干关键问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wanglx199085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球化与知识经济的兴起推动了制造业的信息化进程,知识密集型的制造业得到进一步发展。制造产品的研发、设计、制造等过程积累了大量的工程文档,这些文档不仅是企业技术的积累,更是企业创造价值的重要知识储备。但是,工程环境下的这些文档不仅类型多样、格式各异、规模巨大,而且涉及产品多个阶段、多学科知识等,文档之间的关系复杂,这对当前工程知识的共享与重用提出了新的挑战。工程文档的语义标注与检索是其中的关键,重点解决工程文档内容的语义理解、高效检索等关键问题,这对新一代信息检索、企业创新发展等都具有非常重要的研究与应用价值。  论文在国家863计划项目、博士点基金项目、浙江省自然科学基金重点项目、浙江省重点科技创新团队自主设计项目等相关研究课题的支持下,围绕工程文档语义标注与检索中若干关键问题展开研究,主要工作包括:  1)提出了一种基于语义的工程文档检索总体方法  现有检索方法没有考虑工程文档的多源异质特性,缺少对文档内容语义的理解,对此,提出了一种基于语义的工程文档检索总体方法,包括工程语义建模、工程文档内容获取与语义标注、工程查询语义分析与扩展检索等。该方法能够对工程文档内容蕴含的语义进行理解,消除文档异质性,通过语义分析与查询扩展等技术获取用户查询意图,实现对工程文档基于语义层面的智能检索。  2)提出了一种基于本体与上下文的多模态语义标注方法  针对工程环境下文档结构的特点及语义理解需求,提出了一种基于本体与上下文的多模态语义标注方法。在该方法中,构建了一种基于多本体的语义模型,对多模态语义进行统一表示;提出了一种基于上下文的文本语义自动识别方法、以及一种基于规则和上下文的专利图片语义自动识别方法,形成语义知识库,用于后续知识检索与共享重用。实验结果表明,该方法能自动提取文档内容中蕴含的多模态语义、以及多模态内容之间的关联语义,实现对文档内容的深层次语义理解,进一步提升了语义检索的质量。  3)提出了一种基于多源语义知识的专利文档检索方法  专利文档是一类典型的工程文档,针对专利文档的高效检索问题,提出了一种基于多源语义知识的专利文档检索方法。在该方法中,结合专利文档的结构与领域特性,对查询进行语义分析,提出了相应的专利查询概念产生算法;引入查询特征,对扩展性能进行动态预测,并利用领域知识与外部知识,考虑查询概念与扩展概念之间的语义关联特征,提出了基于领域知识的查询扩展算法、基于外部知识的查询扩展算法。实验结果表明,该方法能对专利长查询意图进行有效理解,不仅获取查询中的明确关键概念,而且利用领域和外部知识获取与查询相关的隐式扩展概念,提高了专利检索的性能。  4)提出了一种基于全局与局部特征相结合的三维模型检索方法  三维模型是一类典型的工程文档,针对三维模型的高效检索问题,提出了一种基于全局与局部特征相结合的三维模型检索方法。在该方法中,采用混合特征线与最佳视角方法生成三维模型的多特征线代表性视图;引入集成全局描述符,从多个方面提取和描述全局特征;提出了一种改进局部特征方法,考虑了局部特征之间的语义关系,将局部特征表示成压缩的可视词分布;提出了一种两阶段匹配提炼策略来评估查询输入与三维模型的相关性。实验结果表明,该方法能充分利用全局与局部特征的互补优势、以及局部特征间的语义关系,提高了模型检索的性能。  5)提出了一种面向复杂组织网络的语义知识服务方法  针对复杂工程环境下的知识共享问题,提出了一种面向复杂组织网络的语义知识服务方法。该方法采用多层知识模型实现多维知识的统一灵活表示,并对知识进行半自动扩充,形成面向复杂工程环境的知识网络。引入知识社区思想,对知识进行协同创建与丰富、协作共享。同时,采用可配置的柔性组织结构和权限管理,确保知识访问的安全性。实际应用表明,该方法能有效地支持复杂工程协作环境下企业之间的知识共享。
其他文献
近年来,随着3D技术的发展,大量的三维场景出现在游戏、教育、建筑设计、广告等领域。然而,传统的三维场景制作工具需要用户在数据库中选择合适的3D模型,然后通过繁琐的三维场景操
随着3D技术的普及,三维数据的获取技术日渐受到人们的重视,在计算机视觉领域内,基于视频序列的深度恢复技术也逐渐成为研究的热点。虽然,针对动态场景,也有很多多目深度恢复技术相
自抗扰控制器(以下简称ADRC)在经典PID控制基础上,进行了改进,通过扩张状态观测器(以下简称ESO)把系统的所有不确定因素都归结到系统的总扰动而给予估计和补偿。这使得ADRC控制过程较简单,且能有效地抑制开关磁阻电机的转矩脉动,其缺点是控制参数较多。开关磁阻电机结构简单,调速范围宽,如何减少其振动和噪声是目前的研究热点。本文设计的开关磁阻电机(以下简称SR电机或SRM)控制系统,采用自抗扰控制
随着城市化进程的推进,城市交通拥堵已成为日益严重的问题。交通仿真技术是分析交通问题的重要途径之一。通过交通仿真,可以对交通规划、交通管控方案进行评估,尽早发现设计
随着信息采集和处理技术、无线通信技术、传感器技术等的不断发展,无线传感网络在信息获取能力和便于布置等方面表现出明显的优势,近年来无线传感网络在生活、工业制造、军事、
牙科计算机辅助设计系统即牙科CAD系统,是牙科技工工艺、计算机视觉与图形学、精密加工等多学科结合的前沿领域。牙科CAD系统作为一类基于形状的计算机辅助产品设计系统涉及形
随着油气田的深入勘探和开发,正确识别断层的空间分布位置显得尤为重要。三维相干体技术的应用在地震断层解释中发挥了前所未有的重要作用。但是当地下岩层存在大倾角、地层
近年来,伴随着信息技术的发展,流数据这一实时、连续、无限的数据类型出现在人们生活的各个领域中。流数据的主要特点是:1)数据量大、数据产生速度快;2)短暂易逝、快速变化;3)数据
随着近年来数据的爆炸式增长,人们的日常生活已经处于一个被“大数据”所包围的情景,而且如果对这些海量数据进行高效的存储日渐成为一个重要的环节,在大型存储系统中如何保证数
表情识别是当前研究的热点方向之一,对于情感分析,人机交互,智能系统方面有重要的意义。人脸运动单元的识别是表情识别的基础,能更加精细的分析不同情感与精神状态下面部特征