面向旅游服务的智能标注及知识图谱构建系统

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wzhqch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断更新和进步,网络信息也在呈指数迅猛增长,如何从海量的网络数据中提取出有价值的信息,并有效地利用起来,受到了人工智能领域的研究者们热切关注,近年来层出不穷的海量数据处理及存储技术相继被提出,其中最为引人瞩目的莫过于知识图谱。知识图谱目前已经在智能问答系统和智能推荐等应用中得到广泛的使用。然而,旅游领域的知识图谱却十分缺少,使得旅游信息不能够得到很有效地利用,这无疑减缓了智慧旅游的发展。针对目前互联网旅游数据量巨大,但并没有得到高效利用的现状,本文以海南地区为例,主要基于旅游游记,从旅游游记中提取出和旅游有关的知识内容,构建一个在现实生活中可供人们使用的旅游知识图谱。首先,基于Scrapy框架构建爬虫系统,从目前主流的旅游网站获取关于海南地区的旅游游记信息。通过对游记数据进行清洗等预处理工作后,进行词频统计分析,挖掘出人们在旅游中切实关注的内容主题,根据分析结果,定义旅游实体及实体关系,构建命名实体识别和关系抽取数据集,用于深度学习模型训练,以便后续对非结构化的游记数据进行旅游实体抽取和关系抽取。其次,使用Protege本体编辑工具进行旅游本体编辑,对获取到的三元组知识进行编辑,接着使用Neo4j数据库,对模式层的本体和数据层的三元组进行存储,再采用实体链接技术对数据进行实体对齐,最后对知识图谱周期性更新的方法进行介绍和探讨,从而实现一个完整的知识图谱构建系统。在构建实体识别和关系抽取数据集时,发现现有标注工具仍然需要大量的人工操作,这无疑令标注数据变得低效,故本论文设计了智能标注系统,快速实现数据标注,减少人工标注成本。最后,为了对构建的旅游知识图谱进行应用,以便用户从中获取需要的信息,本论文特设计了基于知识库的智能问答系统,知识库问答系统主要采用深度学习技术实现知识问答,并设计智能旅游问答助手,以微信公众号的方式呈现给用户,用户可以直接使用自然语言进行提问,问答系统通过对问句进行处理,最后返回相应的答案给用户。
其他文献
现代社会在科技的高速发展中向体验时代迈进,人们对精神文化有了更高的追求。老龙口酒博物馆作为沈阳工业文化的见证者、当代文化教育的传播者,成为历史文化交流的纽带。导览系统作为沟通参观者与博物馆的重要媒介,正朝着基于个人设备的方式发展,有效运用视觉反馈理论能增进用户与导览系统的双向交流,改善博物馆导览的新面貌。本文在归纳现代博物馆数字导览特征的基础上,从色彩、图形、文字、动效四个方面论证将视觉反馈理论引
家蚕(Bombyx mori)是一类重要的经济类昆虫,生长周期短、繁殖率高,是鳞翅目昆虫研究的模式生物。正常家蚕卵在产下初期呈黄白色,最终转变为黑褐色。本团队前期发现一种新型淡红
学位
传统的惯性导航测试中所用的测试仪器过于复杂,体型庞大,而且功能单一化。针对这一问题,本文设计了以虚拟仪器为基础,通过可定制的硬件板卡来模拟惯性测量元器件的信号,并在工控机上编写测试软件系统,通过惯性导航模拟器和自动测试系统能够十分、快速地自动测试惯性导航的功能模块正确与否。本文的研究主要以惯性测量元器件模拟信号为基础,经过实际的工程实验论证,确定了本文主要设计的内容。本文主要讨论的内容如下。首先对
自然保护地在维护生态系统平衡、保持生物多样性、构建景观多元化方面发挥关键作用。我国提出并实施生态文明建设以来,自然保护地建设的相关议题一直是研究的热点方向。当前,伴随生态旅游产业对自然保护地的深度开发,人类干扰逐渐入侵脆弱的生态环境,给自然保护地的生态系统带来一定威胁。而分类与分区管理缺少科学指导,不能很好解决生态保护和经济开发的复杂矛盾。当前,已有功能区划存在较大主观性,分类体系混乱,后续落实缺
日盲紫外探测技术由于背景噪声低和灵敏度高等优点,被广泛应用于火焰检测、高压电晕、生物/化学分析、臭氧层监测、导弹制导及空间安全通信等民用和军事领域。近年来,随着半导体材料与技术的飞跃发展,超宽禁带半导体材料(Al Ga N,Zn Mg O,Ga_2O_3和金刚石)用于研制高性能日盲紫外探测器已成为光电探测领域的研究热点。其中,β-Ga_2O_3是一种直接带隙的新型超宽禁带半导体材料,因其禁带宽度宽
数字化样机平台是为了实现雷达产品数字化、软件化设计验证模式而设计研发的模拟仿真平台,该平台通过通信中间件连接异构处理器计算集群提供高效的软件化信号处理能力,为用户提供雷达信号处理、电子对抗、环境设计等多流程下的设计与模拟验证功能。本文主要讨论其RPC通信中间件模块的设计与实现过程。论文起始部分对雷达数字化、软件化开发技术以及RPC中间件技术国内外的发展现状进行了调研,介绍了数字化样机平台存在的背景
随着我国科技水平的提高与发展,人们对材料性能与质量的要求也日益提高,双金属复合板作为一种新型复合材料,具有两种金属材料的优异复合性能和较低的生产成本等优势。在制备过程中,双金属复合板容易产生波浪、瓢曲、镰刀弯等板形缺陷,对复合板进行矫直已经成为制备双金属复合板的一项必要工作。传统的矫直工艺往往在设计矫直模型过程中忽略中性层偏移现象,所以为了提高矫直加工过程中的矫直精度、降低矫直加工过程后出现的复合
学位
竹类植物是禾本科竹亚科植物的总称,全球共有竹类约有88属1400多种,竹林面积3700多万公顷,主要分布在亚太、拉美和非洲地区。竹子作为重要的多用途森林资源,在世界各国的地区发展和社会发展中起着举足轻重的作用,其研究也越来越受到世界各地的重视。对竹种种类的识别,不仅是竹类学家研究竹类属性与应用的重要前提,也是人们认识竹类、了解自然的方式。近年来随着深度学习在图像分类领域取得的显著进展,为竹种图像分