基于古诗知识图谱的智能问答研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:firemourne
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,数字化信息呈现出指数增长的趋势,给人们从海量数据中快速准确地获取需要的信息带来了挑战。传统的信息获取方式是使用搜索引擎,通过关键词匹配的方法返回大量的相关网页,导致用户需要耗费大量的精力从返回的网页中筛选出自己需要的答案。与传统的基于搜索引擎的信息获取方式相比,智能问答能够精准理解用户的搜索意图,并将答案直接返回给用户,提高了用户信息获取的效率。同时,知识图谱能够作为智能问答的一个高质量数据来源,其快速发展推动了智能问答在多个领域内的应用。目前,在教育领域非常重视古诗知识的学习和运用,但是古诗知识的体系复杂,用户获取古诗信息的方法主要是通过搜索引擎,对于想要根据条件个性化查找古诗信息的用户来说,这种信息获取方式不够高效。因此,本文构建了一个古诗知识图谱,并基于该知识图谱实现了古诗知识的智能问答。本文的研究工作主要包括以下几个方面:第一,古诗知识图谱构建。以关系型数据库中的数据为基础,利用互联网数据进行补充,将不同来源的数据进行融合,构建了能够用于智能问答的古诗知识图谱。第二,基于BERT的问句分类算法研究。常用的分类算法大都采用Word2vec获取文本的词向量表示,这种词向量表示方法存在一定的局限,训练之后的词向量是固定的,不会发生变化。但是同一个词在不同的上下文环境中表达的语义会有所不同。因此,本文使用BERT来获取包含上下文语义信息的词向量,通过BERT实现问句的分类,实验结果表明该方法下的问句分类效果得到了提升。第三,基于加入了条件随机场的双向长短期记忆网络(BiLSTM-CRF)的实体识别算法研究。在实际语境中,单个词的上下文信息会对该词的语义产生影响,传统的神经网络无法捕获长距离的上下文信息。针对此问题,本文使用BiLSTM-CRF去识别问句中的实体,首先双向长短期记忆网络(BiLSTM)能够一定程度上解决文本的长距离依赖问题,其次结合条件随机场(CRF)能够获取实体标签之间存在的依赖关系,最终提升实体识别效果。并且本文在BiLSTM-CRF的基础上验证了不同词向量对算法的影响,实验证明使用BERT预训练词向量的BiLSTM-CRF能获得更好的效果。第四,基于古诗知识图谱的智能问答系统的设计与实现。本文实现了一个基于古诗知识图谱的智能问答系统,在实际运行过程中系统运行状况良好,能够实时对用户的问句进行准确回答,满足用户古诗信息获取的需求。
其他文献
随着国民经济的不断发展,矿产资源需求量日益增大,迫使大部分矿山不断加大生产量,由于生产量的加大,矿石输送任务越来越重,大部分矿山开始采用胶带运输机进行井下矿石的输送
在大力推进“第三次工业革命”的前提下,能源互联网应运而生。在此背景下,以电力系统为核心,融合了天然气、可再生能源、热能、冷能等多种能源形式的综合能源系统逐渐发展起
如何培养一批适应社会高科技发展,适应更多合资企业和外贸公司需要的复合型人才,是每一位商务英语教学者面临的现实问题。结合商务英语教学的特征,从课程设置、教材安排、对
目的:肺癌是最常见的恶性肿瘤之一,在世界范围内居于肿瘤所致死亡人数之首,每年超过1300万。60%左右的腺癌患者发现即为中晚期,很大一部分失去了手术治疗的机会,生存期大幅度
研究了SBS添加剂电积在镍生产过程中的应用效果。试验表明:SBS添加剂可改变阴极表面的润湿性,有效预防电积镍长气孔,改善电积镍的外观质量。
高校贫困生诚信缺失问题越来越突出,最为明显的就是借贷学费不按期偿还、拿着国家奖助学金奢侈消费、缺乏回报社会的意识、缺乏爱心和感恩的心。其主要原因是由于市场经济负面
人理解和推理通过隐喻和框架(架构又译作框架)实现。政治演说就是借助隐喻和框架影响公共话语和人的思想以实现传播其政治主张的目的的。莱考夫和约翰逊的研究认为,隐喻不仅
技术的进步、激烈的市场竞争和消费者要求的多样化,推动着汽车生产企业向市场提供更高技术和更加多样化的产品,以提升产品竞争力。这些市场因素也直接传递至作为汽车产业上游的零部件厂商。M公司作为汽车弹簧及相关部件的供应商,根据市场需求和变化,积极开发新的零部件产品,以满足市场的需求。但与成熟产品相比,质量是新产品开发过程中的重要关注点,也是M公司当前的薄弱领域。加强新产品开发中的质量管理,提升新产品质量,
离职是组织系统内员工对组织失去期望的一种消极行为,离职倾向是离职行为发生前的心理状态。新生代员工作为一个特殊的群体,有着不同于其他群体的对待工作的态度和行为。本研