基于自然语言的知识查询算法研究

被引量 : 0次 | 上传用户:superlhl2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会发展的深入,人类对信息获取、知识查询的便捷及高效有了更高的需求。如此需求之下便产生了强大的动力,促使着广大的科研工作者在问答系统、自然语言查询以及搜索引擎等领域进行深入的理论研究和技术研发。其中,知识库系统中基于自然语言的知识查询,便是其中非常具有研究价值的一个新型领域,知识库系统的核心是知识库,而知识库中,知识表示和知识获取是其研究的核心;而在自然语言处理领域,知识查询算法也亦是其核心领域。知识查询算法中,最关键的是分词算法和匹配算法。论文在此背景下进行知识库系统中基于自然语言的知识查询算法研究。论文研究的理论基础主要有知识工程、自然语言处理、关系模型以及并行计算等相关理论。论文的主要创新点有以下几点:(一)知识查询算法中知识库部分,对语义网络知识表示方法以及关系模型的优劣点进行分析,提出了一种基于关系模型与语义网络相结合的知识表示方法,包括嵌套关系模型和链式关系模型两种逻辑表示。(二)知识查询算法中的智能分词部分,对词库结构进行优化提出新颖的词库索引结构以及对正向最大匹配分词算法进行改进,介绍了一种改进的正向最大匹配分词算法。(三)知识查询算法中句型模板匹配部分,基于数据结构中的树形结构,介绍了一种基于句型解析树的句型模板存储结构。(四)基于句型解析树的存储结构,提出了句型模板粗匹配算法,其中包括过滤算法和树匹配算法,并对查询算法存在的问题提出了优化方案。论文基于上述四点,对基于自然语言(汉字文本)的知识查询进行纯理论研究,但论文的研究也暴露一些问题,主要有:第一,论文是基于纯汉字文本的自然语言查询研究,而当今的社会需求往往是基于汉字、数字、西语等多种文本字符的混合查询,论文的研究范围过窄;第二,论文是基于纯理论研究,对提出的算法只是通过伪码(或自然语言)的形式写出的,并没有通过程序设计实现算法、实验的形式对其性能进行验证和测试。因此在后续工作中应该加强对对算法的验证以及提出更好的优化方案。
其他文献
目的:探讨声脉冲辐射力成像技术在鉴别甲状腺良、恶性结节方面的应用价值。方法:对106例甲状腺结节患者,在手术前均接受常规超声检查和ARFI检查,同时记录检查结果。根据手术后的
目前制冷行业普遍使用的CFCS等人工合成制冷剂,对地球的臭氧层产生了严重的破坏,后续开发的HCFCS类人工合成制冷剂对臭氧层虽然破坏较小,但是对地球有不同程度的温室效应影响
新课程理念倡导数学教育教学活动要面向全体学生,以尊重学生的个性化发展,确保其综合素质得到全面培育。但是当前很多初中生存在数学学困的情况,这显然与当前初中教育改革的
我国是种桑养蚕的发源地,至今仍是世界茧丝绸生产、加工与贸易第一大国,在国际市场上占据着主导地位。长期以来,我国蚕丝业主产地主要分布在江苏、浙江等东部地区。但从上世
十字花科芸苔属植物是世界上许多地区重要的蔬菜和油料作物。中国拥有种类繁多的栽培和野生十字花科芸薹属植物。中国的油菜占世界总产量的30%左右,主要是种植甘蓝型油菜。随
随着汽车不断地进入我国居民家庭,儿童乘车安全问题越来越受到人们的重视。正确使用儿童安全座椅能有效的降低汽车碰撞事故中车内儿童乘员的伤亡人数。目前市场上销售的一些儿
囿于历史文献自身特点及研究方法等,“碎片式”研究是当前区域史研究中的主流。做为国内区域史研究的热点,目前徽学研究中的“碎片式”研究主要包括大量的个案研究和专题研究
<正>2016年的初春,中国雕塑学会青年推介计划的第二季经过一年多的全国巡展,迎来回京在中间美术馆的收官之作。细数第二季的十余站展览,回望从2010年9月在798艺术区中国雕塑
本文主题是论中国画与饮食文化的相通性。论文目的是中国画和饮食文化在美学领域相通性的研究。通过对饮食文化中食物的色香味形等方面剖析,与中国画所呈现给世人“审美”、“
肺癌是全球范围内因癌症导致死亡最重要的原因,在我国,肺癌的发生率和死亡率都呈明显上升的趋势,其5年生存率只有20%左右。其主要原因是大多数肺癌患者在确诊时癌细胞已经发